セマンティックWebの姿がかいま見えた「W3C Day」

2001/11/30

 HTMLとHTTPによってWebの世界を作り上げてきたWorld Wide Web Consortium(W3C)。そのW3Cが、次世代のWebとして考えているのが「セマンティックWeb」だ。11月29日に慶應義塾大学で行われたW3Cのイベント「W3C Day」では、そのセマンティックWebの姿をかいま見ることができた。

会場となった慶應義塾大学 三田キャンパス

 現在のHTMLでは、写真の画像のわきに撮影日が表示されていたり、店舗のWebページに住所や営業時間が書いてあったとしても、それはWebページとして人間が目で見るためにだけ使われる。コンピュータには、それらの情報が撮影日や営業時間を示していることが分からないため、検索エンジンで「1997年5月に撮影された山田さんの写真」や「朝6時に営業している東京の靴屋」といった条件で検索しても、Webページを正確に見つけることはできない。

 現在のHTMLとHTTPでできたWebの世界は「人間が読んだり見たりする空間」である。これを、「コンピュータも意味が分かる情報空間」に押し広げようというのがセマンティックWebのコンセプトだ。

主催者としてあいさつするW3C広報の北川和裕氏

 そのためには、現在のWebページに、コンピュータが読める情報を「メタデータ」として追加する必要がある。写真の画像のわきに、撮影日や撮影者、写っている人の名前を、店舗のWebページには営業時間や取扱商品をメタデータで書き込む。メタデータのフォーマットにはXMLが使われる。

 こうすることで、コンピュータは店舗の営業時間や、写真の撮影日などの情報を正確に知ることができる。するとコンピュータは「水曜日に深夜まで営業している旅行代理店」を発見し、複数店舗あれば「その中で一番安い、大阪行き新幹線のチケット」を探して、購入手順を理解して購入する、といったことが自動的に行えるようになるというわけだ。

 この日、「Semantic Webへの取り組み」というセッションで講演した萩野達也氏は、こうしたセマンティックWebの利用例を示したうえで、その実現には、用語間の関係を示すための用語「オントロジー・ボキャブラリ」の設計や、メタデータの入力を可能にするオーサリングツールなど、まだ多くの技術が必要とされるとした。

 Jose Kahan(ホセ・カーン)氏の講演、「Annotea An Open RDF Infrastructure for Shared Web Annotations」では、セマンティックWebを実現する技術的な枠組みがすでに動いているところを見せた。具体的には、既存のWebページに対して外部からリンクを張り、見かけ上そのWebページにだれもが自由に注釈の形でメタデータを付加できるデモンストレーションを示した。現状の注釈は、英語などの自然言語で記述することができるが、オントロジー・ボキャブラリが整備されれば、コンピュータにも解釈可能な形でのメタデータが記述できるという。

 W3C自身、セマンティックWebの実現にはまだ遠いと考えている。この先多くの技術開発と標準仕様、そしてそれを採用する賛同者が必要となる。W3C Dayはそのための一歩だったといえるだろう。

(編集局 新野淳一)

[関連リンク]
W3C

[関連記事]
2001年/11月版 W3C Dayが待ち遠しい (XML eXpert eXchange)

 

情報をお寄せください:



@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)