世界初の言語解析エンジン、単語の意味も解析可能

2006/6/16

Sematics 代表取締役 吹谷和雄氏

 Sematicsは6月15日、独自の日本語解析エンジン「Perceptrons Engine」(パーセプトロンエンジン)を開発したと発表した。アプリケーション・ソフトウェアに組み込んで使用する。応用例としては、多言語変換やデータ・マイニングなど。年内には英語版エンジンの開発も予定している。同社 代表取締役 吹谷和雄氏によると、「英語版の市場規模は日本語版よりも巨大」だとし、米国市場に参入を開始する3期(2007年度)には40億円強、4期(2008年度)には120億円の売上げを見込んでいる。

 従来の日本語解析エンジンは、辞書を作成し、解析時はその巨大な辞書データを検索するなど、パフォーマンス面で大きな課題を持っていた。また、解析のためのアプローチは統計的(確率モデル)技術が主流だったが、この技術の欠点は、「文脈解析」や「意味解析」といった、文章構造のより高度な解析結果が曖昧だという点にあった。

 パーセプトロンエンジンは、辞書を持たないことで処理速度を大幅に向上させたほか、「文脈解析」や「意味解析」まで実現できる解析アプローチ(トポロジーを用いた数学的アプローチと同社では説明)を採用した。これにより、単語が持つ意味の概念抽出を実現、文節間の文法的関係と意味的関係までも解析できるようになった。

 このような日本語解析エンジンを組み込んだアプリケーション・ソフトとして、同社がデモンストレーションを行ったのはWebの“法律相談システム”だ。依頼者が自然文で入力した相談内容を解析し、その相談内容から足りない情報をシステムが自動で問い返しながら、過去の判例と照合し、結果を推測して可能性として出力するというもの。そのほか、医療、金融などの相談システムとしても応用できるという。

(@IT 谷古宇浩司)

[関連リンク]
Sematics

[関連記事]
Googleニュース日本語版、直リンク問題を抱えてスタート (@ITNews)
SASのデータ分析ソフト「JMP」とは? (@ITNews)
セマンティックWebが科学コミュニケーションを救う (@ITNews)
FSTとプロトン、Webアクセスログ解析分野で提携 (@ITNews)
MS、Windows CE用アプリケーション開発環境受注開始 (@ITNews)

情報をお寄せください:



@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)