ポイント#5 整形式な文書と妥当な文書
XML文書はタグで内容をマークアップしていくものだ、ということは説明した。また、要素の中に要素を入ることができる。要素の中に要素を入れたとき、外側の要素は内側の要素の「親」と見なされ、下記のようなツリー構造として表現できる。
<a t="x"> <b><d></d>Hello</b> <c><e></e></c> </a>
正しいXML文書であるためには、これ以外にもツリー構造の最上位に単一の要素(ルートエレメント)が存在していることが必要だ。このように正しく記述されたXML文書のことを「整形式のXML文書(Well-formed Document)」という。整形式のXML文書は、あらかじめ文書型定義などによる構造の定義が不要なため、厳密な情報交換が求められるBtoBなどの用途よりも、文章による情報に対する意味づけなどの柔軟性の高い利用に適している。
<Document1> <Document1> <Name>山田太郎</Name> <Name>山田太郎</Name> </Document1> <Document2> <Document2> </Document1> <Company>佐藤工業</Company> <Company>佐藤工業</Company> </Document2> </Document2>
整形式でないXML文書の例。左の例は最上位の要素が2つある。右の例は、タグの親子関係が崩れている
一方、XML文書の中にDTDが含まれており、このDTDに対して完全に適応したXML文書の場合、それを「妥当なXML文書(Valid document)」という。
XML文書の妥当性をチェックしたり、階層構造に文書を展開する処理を行うXML処理エンジンをXMLパーサという。XMLパーサはXMLを読み込んで処理をする場合に必要になる。各種データベースに組み込まれていたり、マイクロソフトやIBMなどからは無償で提供されている。
Copyright © ITmedia, Inc. All Rights Reserved.