Database Watch 12月版 Page 1/2

TX1とCyber Luxeon、相次いで新バージョン投入


加山恵美
2006/12/13

 今月はXMLデータベースの話から始めましょう。同時とはいえませんが、近いタイミングで2つのXMLデータベースの新バージョンがリリースされます。これらは対照的な存在でもあり、その違いや経緯を考えると興味深いです。

大容量のデータ検索性能を強化、TX1 V2

 まず1つ目は最も若いXMLデータベースのV2リリースです。東芝ソリューションはXMLデータベースの新バージョン、「TX1 V2」の販売を11月28日から開始しました。TX1が初めて登場したのは2005年4月であり、XMLデータベース製品の中では最も若いといえます。この製品の特徴はテラバイト級の大容量データでも高速検索が可能という点です。最初のバージョンが登場してから1年半強で次バージョンのリリースとなりました。

 TX1の登場以前はテラバイト級データにも対応可能なXMLデータベースというと、メディアフュージョンの「EsTerra」が有名でした。そこにTX1が登場し、大容量XMLデータの高速検索を特徴とする製品が増えました。TX1がテラバイト級の大容量データでも高速な検索を可能とするのは、スキーマアナライザとクエリオプティマイザという技術がポイントとなります。

 スキーマアナライザはXML文書から構造を自動的に抽出する技術です。XML文書が持つツリー構造を自動的に分析して索引を作成します。加えて、ここで得た構造情報から最適な問い合わせプランを作成するのがクエリオプティマイザです。なおここでの問い合わせはXQueryを用います。TX1は階層構造を自動的に分析するスキーマアナライザと、そこから自動的に最適な問い合わせをするクエリオプティマイザの両軸により、高速な検索を実現しています。

 V2では自然言語処理機能とデータ連携機能が加わることが特徴です。自然言語処理機能はNグラム方式と形態要素解析方式を使い分けて検索性能を向上させています。なおNグラム方式とは隣接する文字列で索引となる文字列を切り出す方式で、「東京都」なら「東京/京都」というように索引ができるので、キーワード検索の対象となるようなデータに適しています。一方、形態要素解析方式では意味のある文字列を切り出す方式で「バージョン管理」なら「バージョン/管理」と索引ができるので、長い文章に適しています。

 もう1つの特徴となるデータ連携機能は、多様な形式のデータをXMLに変換してTX1に登録する機能です。企業内にはRDBMSやIBM Lotus Notes/Dominoといったグループウェアに格納されたデータが大量にあり、こうした異なるシステムに格納されているデータを横断的に検索するのは困難です。そこでこうしたデータをXMLに変換し、すべてTX1内で一気に検索ができるようにするのが狙いのようです。

老舗XMLデータベース、Cyber Luxeon Ver 2.0

 もう1つは老舗といえるXMLデータベースのV2リリースです。サイバーテックはXMLデータベースの新バージョン「Cyber Luxeon Ver 2.0」の出荷を来る12月25日から開始します。Cyber Luxeonという名前はやや目新しく感じるかもしれませんが、実はXMLデータベースの中では最も長い歴史があるのです。

 少し歴史を振り返ってみましょう。W3CでXML 1.0が初めて勧告になったのは1998年2月です。その翌年、1999年3月にはネイティブのXMLデータベースとなる最初の商用製品が登場します。これが当時オブジェクトデザイン社(現在は米プログレスソフトウェア社、日本ではソニックソフトウェア社から提供)から出荷されたeXelonです。

 eXelonはオブジェクトデザイン社が提供するオブジェクト指向データベース「ObjectStore」を基本エンジンとしています。そのため白紙から作成したものではなく、オブジェクトデータベースの技術が下地にあります。

 世界最初のXMLデータベースであり、良くも悪くもこの製品がXMLデータベースのスタイルを確立し、後の製品にも影響を与えます。ここでいうスタイルとは、スキーマを必要としないこと、XPathやXQuery、XSLTなどXML基礎技術を搭載していることなどです。

 その後、eXelonはSonic社に買収され、2004年からSonic XISと製品名を変えます。さらに2005年8月にサイバーテック社がこの製品の事業を取得して、日本で開発および販売を開始します。それで2006年4月からCyber Luxeon Ver 1.0と名前を改めて再出発したという経緯があります。そのため、Ver 2.0といっても長い歴史があります。技術には関係ありませんが、身寄りがいろいろと移り変わり、人生に例えるなら波瀾万丈というところでしょうか。

 今年再出発したCyber Luxeon Ver 1.0では、Windows 2003サーバや新しい開発環境への対応、最新のObjectStore(Ver 6.3)の組み込み、Sonic XISのバグ解消や互換性、パフォーマンス改善などが特徴となっています。

 新しいVer 2.0で最大の特徴はターボサーチ機能です。これは日本語の高速な全文検索機能を実現するもので、Nグラム方式を採用しています。もう1つはフォルダDB機能です。これは複数のXMLファイルをまとめて1つのフォルダに格納するようなイメージで、ルールに従って自動的にひも付けを行います。これによりフォルダ内で横断的な検索や一括更新が可能となります。新バージョンでは検索機能をより強化したのが特徴といえそうです。

  1/2

 Index
連載 Database Watch 12月版
TX1とCyber Luxeon、相次いで新バージョン投入
Page 1
・大容量のデータ検索性能を強化、TX1 V2
・老舗XMLデータベース、Cyber Luxeon Ver 2.0
  Page 2
・XMLデータベース第1世代と第2世代
・PostgreSQL 8.2 リリース
・データベースセキュリティガイドライン掲載
・2回受験するならお得、MCPアクションパック


Database Watch



Database Expert フォーラム 新着記事
@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)

注目のテーマ

Database Expert 記事ランキング

本日月間