連載:グループウェア徒然草(3)

グループウェアはデータベース?

関 孝則
2001/6/28


 グループウェアの機能の1つとして、いろいろな文書を格納するという「文書データベース」的な側面を持っていることは、皆さんもご存じかと思います。Webやクライアント/サーバのシステムでは、データを大量に扱うときには必ずといっていいほどリレーショナル・データベースが使われています。しかし、グループウェアでは文書のデータベースといっても、リレーショナル・データベースを使っているという話はほとんど聞きません。今回は、グループウェアで使われているデータベースについて技術的に考えてみましょう。

独自データベースが主流

 リレーショナル・データベースを使わないグループウェアでも、多くのグループウェアは何らかのデータベース的なものを持ち合わせています。一番有名なのがロータスのNotes/DominoのNSFデータベースでしょうか。マイクロソフトはExchange Server 2000でWSSというデータベース的なものを導入しました。サイボウズのサイボウズOfficeも、独自のオブジェクト指向型のデータベースを利用しているといっています。

 一方、リレーショナル・データベースはグループウェアが登場した10年前よりはるか以前から存在していました。現在では、いろいろなデータ形式をサポートできるようにオブジェクト的な概念も導入し、さらに進化しています。リレーショナル・データベースのエンジニアからは、「グループウェアもリレーショナル・データベースを使えばよいのに」という声さえ聞こえてきます。しかし、バージョンアップを重ねたグループウェアのほか、新たに登場した製品でさえも、リレーショナル・データベースを使う取り組みはほとんど見られません。どうやらそこには訳がありそうです。

コミュニケーションの不完全さと自由さ


Illustration by Sue Sakamoto

 グループウェアがなぜリレーショナル・データベースを使わないかを考えるには、やはりその扱うデータについて考えてみるのが1つの近道かもしれません。グループウェアが扱うデータは、基本的にグループの協調作業という側面からコミュニケーションに関するものが主と考えられるでしょう。そのコミュニケーションといえば、人間同士の会話、何かを伝えるメモ、きちんと物事を伝える報告書や文書、そしてワークフローなどで出てくる伝票やフォームなどがあります。

 これらコミュニケーション手段のコンピュータ化で特徴的なところといえば、入力するフィールドが完全なフリーフォーマットだったり、一部決められたフィールドがあったとしても残りはフリーフォーマットで、さらにフリーフォーマットの部分にはいろいろな形式のオブジェクトやファイルを添付したりできるところでしょうか。あるいは、その文書自体がオフィスアプリケーションやマルチメディアのファイルだったりすることもあるでしょう。コミュニケーションの種類によってその度合いはまちまちですが、そのデータの非定型的や半定型的なところがその特徴の1つといえるかもしれません。

 選択可能なフィールドに該当するようなデータが存在せず、予期しなかったような新たなキーワードがそこに入力できるようになっていないと困る場面もあります。今までなかったキーワードなので、それを事前に登録してから報告書を作るとか、メモを作るとかいった具合では、円滑なコミュニケーションが阻害されます。これを非定型的や半定型的という特徴と併せると、リレーショナル・データベースから見るといかにも不完全なデータといえるでしょう。

 さらに、あるメモや文書は、Webページやディスカッションなどで見られるように、ほかの関連する文書と連携したり、その文書の子供、孫に当たる文書と文書のスレッドとしてのつながりを必要としたりします。いろいろな内容が入れられ、かつ不完全なものを許し、さらに自由に関連付けできるといったコミュニケーションのデータの不完全さや自由さが、ここで浮かび上がってきます。

コミュニケーションの非計画性

 もう1つ、グループウェアのデータの扱い方に特徴的なところがあります。集めたデータを検索したり、表示したり、分類したりするのは普通のデータベースでも行うことですが、これらを設計時ではなく「利用時に非計画的に行う」ところは特徴的といえるでしょう。

 特定の文書やメモを探すのには、あるフィールドでソートした一覧が便利ですが、電子メールでも分かるように、日付時間順、発信人名順、サイズ順、サブジェクト順などのほか、それらを組み合わせて使いたいときもあります。さらに究極は、全文検索で特定の文字列を基に目的のメールを探すこともしばしばです。表示方法もそれに伴い、ソートの順に合わせてあるフィールドは前に、それ以外は後ろにと、場合に応じて自由に変えたいという要望が出てきます。

 またこれも電子メールの例でよく分かるように、個人ごとに異なるフォルダで、しかもフォルダの入れ子の関係まで作って分類していくのが、文書管理の宿命のようなものでもあります。これは、コミュニケーションがいかに個人に依存しており、ある意味で前もって決められない非計画的な側面を持っているということの表れといえるでしょう。

グループウェアをリレーショナル・データベースで作ったら?

 このようなコミュニケーションにおけるデータの性質は、完全なデータを計画的に高速でアクセスすることができるようにするリレーショナル・データベースの目的と、明らかに反するようにも思えます。そして逆に、これらの性質のサポートがグループウェア独自のデータベースの目的となっている部分があります。しかしこれだけのデータの性質を挙げても、おそらくリレーショナル・データベースの専門家からはきっと、「今のリレーショナル・データベースなら実現できる」という答えが返ってくるかもしれません。

 確かにバイナリのデータまでBLOBという形式で扱え、オブジェクト指向的な要素まで兼ね備えた最新のリレーショナル・データベースであればできないことはないのかもしれません。しかし、リレーショナルでない階層型やネットワーク型のデータベースが、部品管理など特定のアプリケーションではまだ重宝されているという事実、また究極の自由度を持つファイルシステムそのものもまだまだ使われているという事実を見ると、グループウェアの不完全で、自由で、非計画的なデータを扱うデータベースの存在を否定することはできないように思えます。

 データベースシステムの本来の目的の1つは、アプリケーションをデータの管理から解放させ、アプリケーション開発者が楽をすることができるように、データベースシステムがいろいろなデータの性質を維持管理し、決まった処理を代行することにあります。リレーショナル・データベース上にそれらの仕組みを苦労して構築するというのは、それらの機能をすでに備えたデータベースがある限り、できるだけ避けるべきことではあるでしょう。

非定型データベースはどこへ行く

 このように考えてみると、非定型データベースがリレーショナル・データベースのように1つのジャンルとして確立してくるというシナリオもあり得るかもしれません。ただ一方では、オブジェクト指向への拡張などによって、いろいろな柔軟性がリレーショナル・データベースにも備わってきています。またファイルシステムでさえ、ファイルにいろいろなプロパティを付随させることで、全文検索も高速にできるように作られているものがあります。これらはまさに、グループウェアの独自のデータベースの機能と重複する部分でもあります。

 また最近、データベースシステムとしてではありませんが、データの形式としてXMLが大きくクローズアップされてきました。その1つの側面として、文書という非定型的/半定型的なものをXMLで表現するという流れが、ワープロなどのオフィスソフトで見られるようになっています。そしてこのXMLはまた、いろいろなデータベースシステムとも結び付こうとしています。

 このような既存の技術の拡張、新しい技術の登場と既存の技術との融合は、おそらくグループウェア独自のデータベースの世界にも大きな影響を与えるでしょう。この動きはいずれグループウェアにも、独自のデータベースを発展させて業界の標準的な形を作り出すか、あるいはそれ以外の現在標準的な技術の発展によってその世界に移っていくか、といったような流れを見せるかもしれません。いずれにしても、今現在はまだその答えは見えていないようです。


筆者プロフィール
関 孝則(せき たかのり)
新潟県出身。国産コンピュータメーカーでの経験を経て、1985年IBM藤沢研究所へ入社。大型計算機のオペレーティングシステムなどの開発、IBMの著作権訴訟、特許権訴訟の技術調査スタッフなどを担当。1994年から日本IBMシステムズ・エンジニアリングでロータスノーツの技術コンサルティングを統括。代表的な著書に、リックテレコム社『ロータスドミノR5構築ガイド』(共著)、ソフトバンク ノーツ/ドミノマガジンの連載『ノーツ/ドミノ・アーキテクチャー入門』、日本IBMホームページ上のWeb連載『SE関のノーツ/ドミノ徒然草』など。
メールアドレスはts@jp.ibm.com


「Master of IP Network総合インデックス」



Master of IP Network フォーラム 新着記事
@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)

注目のテーマ

Master of IP Network 記事ランキング

本日 月間