XML 1.1を巡る「ボヘミアン」と「貴族」の階級闘争

2003/2/22

日本アイ・ビー・エム東京基礎研究所の村田真氏

 Developers Summit2003(翔泳社主催)の2日目にXMLセッションで登壇した日本アイ・ビー・エム東京基礎研究所の村田真氏は「XML 1.0の将来とスキーマ言語」と題する講演を行った。「XMLの基礎的な事柄に関する問題だが」と前置きを行って展開したのは、XML1.1で追加される機能の変更点について。村田氏は「スキーマ言語」と「サブセット」の2点に絞って問題点を指摘した。

 1つ目の議論の焦点は、XMLからDTD(Document Type Definition)を撤廃し、現在のXML仕様のサブセットを作る動きだ。DTDは、XMLのスキーマ言語の一種であり、XML 1.0の仕様書の中で規定されているため、XMLにおけるもっともベーシックなスキーマ言語と言えるが、村田氏は「名前空間を使えず、データ型もないDTDは、将来的には必要とされなくなる。そもそもSGMLとの互換性維持を目的とした機能であり、本来なくても問題はない」と言う。しかし、DTDをなくすことでそれ以外の付随する機能も消滅することは確実。その結果、サブセット仕様の統一作業は今以上に煩雑な作業を伴い、相互運用性の確保が非常に難しくなるという問題がある。実際にはすでに複数のサブセットが「乱立」(村田氏)している状態である。

 もう1つの議論は、XML文書をテキストではなく、バイナリ形式で表現することについての議論だ。バイナリ化することで、メモリやディスクの消費を抑えられる点、転送速度の向上、処理時間の短縮、ランダムアクセスの実現、消費電力の低下などの利点が見込め、この点についてもさまざまな「方言」が存在する。

 これについても当然のように問題点が指摘されており、方言の乱立による相互運用性の欠如、スキーマが変更された場合に読めなくなる可能性、文書とデータの統一性の喪失などがあげられる。

 村田氏は「実はこのような問題は、XMLの規格化にかかわる人々の『階層化』の問題が根底にあるのだ」と言う。つまり、文字列を最重要視し、XMLを従来のようにテキスト処理中心のままにしておき、スキーマがなくとも処理可能で、必要ならバインディング・ツールを使用すればよいとする人々の陣営を村田氏は「ボヘミアン」と名づける。一方で、型情報を最重要視し、スキーマがなくてはデータに意味はないとする陣営がある。XpathXSLT2.0も型情報ありきで動作すべきだとする意見を持つ彼らを、村田氏は「貴族」と呼ぶ。

 「ボヘミアン」と「貴族」の抗争はスキーマ言語の規格を巡って表面化している。前者はOASISで規格化、そしてISOで規格化目前のRELAX NG、後者はW3Cで規格化が進行しているXML Schemaをそれぞれ担いでいる。村田氏は「ボヘミアン」に属するのだが、「いつまでも対立しているのは意味がない。共存を目指して検討中である」とし、「手打ち」を目指して奮闘している。

(編集局 谷古宇浩司)

[関連リンク]
翔泳社

[関連記事]
世界を相手に戦う技術、IPAが発掘・育成 (@ITNews)
W3CのXML Schemaが勧告候補として公開 (@ITNews)
W3Cスキーマに対抗するXMLの新仕様「RELAX NG」 (@ITNews)
ネイティブXMLデータベースの最新版、XML SchemaとWebDAVをサポート (@ITNews)
W3Cテクニカル・アーキテクチャ・グループの最新議論 (@ITNews)

情報をお寄せください:



@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)