Database Watch 5月版 Page 1/2

“データベースの真実”をめぐる熱き論戦


加山恵美
2006/5/20

 ここ最近XMLへの関心が再び高まっているような気がしませんか。かつてほど大々的ではありませんが、静かなブームのように感じています。これまで続いた進歩が積み重なり、いまようやく本格的な導入が現実味を増す段階に到達したのではないかという気がしています。

XBRLは財務分野でなくてはならない存在

 単にXMLといってもいまは応用技術が幅広く展開しており、その根底にあるXMLそのものにはあまり目を向けられることはなくなってきています。それだけXMLが「当たり前」のように普及している証拠なのでしょう。いまさらXMLに着目するほどではないにしても、空気のように欠かせない存在です。無視するわけにはいかないのです。

 いい例が財務報告用の国際的なXML標準、XBRL(eXtensible Business Reporting Language)です。日本でもXBRLは東京証券取引所のTDnet(Timely Disclosure network)をはじめ、国税電子申告・納税システムのe-Taxで採用されるなど実績があります。

 特に今年に入ってからXBRLのニュースが続いています。まず2月には日本銀行の金融機関から報告される財務データで導入が始まりました。また4月21日の金融庁発表にある業務・システム最適化計画でも、EDINETへのXBRL導入が言及されています。工程表によると今年から法制整備やシステム設計に着手し、2008年度には本番稼働が予定されています。

 さらに4月25日からは東京証券取引所では決算短信XBRLデータの試験公開が始まりました。生きたデータが試験公開されることにより、ようやく技術検証や開発に着手できるようになるのではないでしょうか。「待ってたぜ」と腕まくりするエンジニアの声が聞こえてきそうです。

 こうしていまXBRLは破竹の快進撃を続けているところです。XBRLにとどまらず、ほかの方面でもデータのXML化は着実に進んでいます。

XMLとデータベースの関係を復習

 そうなるとシステムでXMLを交換し、蓄積する必要性が増してきます。さて前置きが長くなりましたが、ここでXMLとRDBMSの関係について復習してみましょう。最初に押さえておくべきこととして、XMLはツリーでRDBMSはテーブルといったデータの姿に違いがあります。必然的にXMLのツリーとなっているデータをRDBMSのテーブルにどう格納するかが問題になります。

 1つはツリーを丸ごとどかんとテーブルのカラムに挿入する方法です。XMLを文書として扱うならこちらがいいでしょう。ツリーをそのまま入れるのですから、カラムはプール並みに大きくなることもあると想像できます。こういうときにRDBMSではCLOB型という大容量テキスト向けのデータ型が使われます。こうしてツリーをそのまま入れられるタイプのデータベースのことを「ネイティブXMLデータベース」と呼びます。また検索のためにサイドテーブルを作成する場合もあります。

 もう1つの方法は、ツリーをばきばき分断してテーブルに収める方法です。データ交換向けにはこちらがいいでしょう。ツリーの枝を切り落として果実だけ収穫して箱に収めるようなイメージなので、必要なもの以外は除去されてしまいます。ちなみにツリーを分断することをシュレッディングといいます。一度シュレッディングをしてしまうとツリーを元に戻すのは困難なので、完全にツリーに戻せなくてもいいならこちらがいいでしょう。このタイプは「XMLが利用可能なデータベース」と呼ばれます。RDBMSに収まった後はツリー構造はなくなります。

 XMLのデータをRDBMSに収める場合はいずれかの方式を選ぶことになりますが、どちらも利用可能なデータベースを「ハイブリッドXMLデータベース」といいます。主要な商用RDBMSは昨年(2005年)のバージョンアップの後にはほぼどれもがハイブリッド型になったようですが、多少実装に違いがあるようです。

XMLデータベース製品群といえば

 数年前まではネイティブXMLデータベースといえばTaminoNeoCoreなど専用のデータベース製品群を指し、RDBMSはXMLが利用可能なデータベースにとどまっていました。ところが近年RDBMSが続々とハイブリッドの要件を満たすようになり、ネイティブXMLデータベースの影が薄くなるのではという懸念もありました。しかしネイティブXMLデータベース製品群も負けてはいません。XMLとの親和性の強さをよりいっそう引き出し、XMLの処理能力や効率的な活用を特徴としてアピールしています。

 大容量を特徴とするネイティブXMLデータベースもあります。その老舗が2001年にリリースされたメディアフュージョンのYggdrasill(イグドラシル)です。名前は北欧神話に出てくる巨大な木が由来で、一見して海外の製品かと思いますが実は純国産です。しかも国内初のXMLネイティブデータベースです。2005年12月からGPLライセンスに基づき無償で公開となりました。また同社はYggdrasillを基に取り扱いデータをテラバイト級に進化させたEsTerraも提供しています。

 少し前までテラバイト級のXMLデータベースはEsTerraの独壇場でしたが、どっこい、ライバルが登場しました。2005年4月に東芝ソリューションがTX1を発表したからです。今後はどうなるのでしょうか。

  1/2

 Index
連載 Database Watch 5月版
“データベースの真実”をめぐる熱き論戦
Page 1
・XBRLは財務分野でなくてはならない存在
・XMLとデータベースの関係を復習
・XMLデータベース製品群といえば
  Page 2
・どっちの真実が真実か?
・いよいよヘビが登場か
・MySQLユーザーの祭典


Database Watch



Database Expert フォーラム 新着記事
@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)

注目のテーマ

Database Expert 記事ランキング

本日月間