人工知能を使った全文検索システム、住友電工情報システムが発売日本語の意味を考慮して検索

住友電工情報システムは、日本語の意味を踏まえて検索できる全文検索システムを発売する。人工知能を活用して構文解析と意味解析を行い、単語の係り受けや、肯定/否定表現、動詞の同義語を考慮した上で検索できるという。

» 2018年09月03日 11時00分 公開
[@IT]

 住友電工情報システムは2018年8月30日、全文検索・情報活用システム「QuickSolution 11」を同年9月3日に販売開始すると発表した。AI(人工知能)を活用して日本語の意味を考慮して検索できる新機能「セマンティック検索」を備えた。

 セマンティック検索は、利用者が入力した検索文の意味に合ったデータを優先して検索結果の上位に表示する機能。検索文と検索対象データのそれぞれに対して、住友電工情報システムが独自に開発したAIで構文解析と意味解析を行うことで可能にした。

 セマンティック検索の特徴は、大きく分けて3つある。1つ目は、主語や述語、目的語、修飾語の関係を踏まえて検索する点。これによって検索文の意味に合ったデータを検索結果の上位に表示する。例えば検索文として「日本の消費者を守る法律」を入力した場合と「日本の法律を守る消費者」を入力した場合を比較すると、単語単位ではどちらの文も同じ言葉が使われているが、前者は「消費者」を「守る」という構文に基づいて検索するため、「法律」を「守る」という構文に基づく後者の検索結果とは異なる。

 2つ目は、検索文と検索対象データのそれぞれに対して、肯定表現と否定表現の意味を捉えて検索する点。例えば「景気の影響を受けない業界」という検索文を入力した場合、先ほどの1つ目の例と同様に、似た単語が使われていても「景気の影響を受ける業界」という意味合いの文を、検索結果の上位に表示しない。

 3つ目は、動詞の同義語を検索できるようにした点。これまで対応していた名詞の同義語に加えて、動詞の同義語も考慮して検索するようにした。例えば「野菜を育てる」という検索文を入力した場合、「栽培する」という動詞が使われている文も検索結果に含める。

 QuickSolutionは1台のPCで1億2千万個のファイル、50TBのデータ検索が可能。それ以上のデータにも複数のPCを組み合わせた分散検索で対応する。

 検索対象はファイルサーバに加え、Webサイトや各種データベース管理システムなど。異なるデータソースも横断的に検索できる。今回新たに備えたセマンティック検索の他にも、キーワードの出現度合いを考慮した検索や、文書ファイルのタイトル自動抽出、類似文書の集約などが可能だ。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。