人工知能を使った全文検索システム、住友電工情報システムが発売:日本語の意味を考慮して検索
住友電工情報システムは、日本語の意味を踏まえて検索できる全文検索システムを発売する。人工知能を活用して構文解析と意味解析を行い、単語の係り受けや、肯定/否定表現、動詞の同義語を考慮した上で検索できるという。
住友電工情報システムは2018年8月30日、全文検索・情報活用システム「QuickSolution 11」を同年9月3日に販売開始すると発表した。AI(人工知能)を活用して日本語の意味を考慮して検索できる新機能「セマンティック検索」を備えた。
セマンティック検索は、利用者が入力した検索文の意味に合ったデータを優先して検索結果の上位に表示する機能。検索文と検索対象データのそれぞれに対して、住友電工情報システムが独自に開発したAIで構文解析と意味解析を行うことで可能にした。
セマンティック検索の特徴は、大きく分けて3つある。1つ目は、主語や述語、目的語、修飾語の関係を踏まえて検索する点。これによって検索文の意味に合ったデータを検索結果の上位に表示する。例えば検索文として「日本の消費者を守る法律」を入力した場合と「日本の法律を守る消費者」を入力した場合を比較すると、単語単位ではどちらの文も同じ言葉が使われているが、前者は「消費者」を「守る」という構文に基づいて検索するため、「法律」を「守る」という構文に基づく後者の検索結果とは異なる。
2つ目は、検索文と検索対象データのそれぞれに対して、肯定表現と否定表現の意味を捉えて検索する点。例えば「景気の影響を受けない業界」という検索文を入力した場合、先ほどの1つ目の例と同様に、似た単語が使われていても「景気の影響を受ける業界」という意味合いの文を、検索結果の上位に表示しない。
3つ目は、動詞の同義語を検索できるようにした点。これまで対応していた名詞の同義語に加えて、動詞の同義語も考慮して検索するようにした。例えば「野菜を育てる」という検索文を入力した場合、「栽培する」という動詞が使われている文も検索結果に含める。
QuickSolutionは1台のPCで1億2千万個のファイル、50TBのデータ検索が可能。それ以上のデータにも複数のPCを組み合わせた分散検索で対応する。
検索対象はファイルサーバに加え、Webサイトや各種データベース管理システムなど。異なるデータソースも横断的に検索できる。今回新たに備えたセマンティック検索の他にも、キーワードの出現度合いを考慮した検索や、文書ファイルのタイトル自動抽出、類似文書の集約などが可能だ。
関連記事
- SRA、ソースコード検索システム「CodeDepot」をオープンソースソフトウェアとして無償公開
創立50周年を迎えるSRAは、同社が開発したソースコード検索システム「CodeDepot」のソースコードを、2017年12月1日に無償で公開する。 - Microsoft、「人間のように文書を読んだり、質問に答えたり」するAIを開発
Microsoft Research Asiaが開発したAI技術が、人間並みの読解力スコアを記録した。 - 【Chrome】アドレスバーからGoogle以外の検索エンジンで素早く検索する
Google以外の検索エンジンでWebを検索したい場合、いちいち検索サイトを開いて検索文字列を入力するのは少々面倒です。そんなときにGoogle Chromeの標準機能だけで、アドレスバーから素早く検索する方法を紹介します。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.