マイクロソフト、「コンピュータが、人間のように概念化して考えられるようになる」技術を開発:「Microsoft Concept Graph」を公開
マイクロソフトの研究部門 Microsoft Research Asiaが、コンピュータが人間のように物事を概念化して処理できるようにするために必要となる技術「Microsoft Concept Graph」を開発。AIなどの研究用としてプレビュー版を公開した。
米マイクロソフトの研究部門 Microsoft Research Asia(北京)は2016年11月1日(現地時間)、コンピュータが人間のように物事を概念化するのを支援する技術「Microsoft Concept Graph」を開発したと発表した。
Microsoft Research Asiaのシニアリサーチマネジャーで、Microsoft Concept Graphの開発プロジェクトに携わっているジュン・ヤン氏は、この技術の基本的な考え方をこう説明する。「コンピュータの限界は、常識的な知識や、意味を理解する方法を持っていないことにあると考える。コンピュータは、言葉の文字の並びなどは認識できるが、人間のようにこれまでの背景から物事を理解するまでの知識は持っていない。私たちの研究は、抽象度の高い常識的な概念をコンピュータに提供し、コンピュータが人間のコミュニケーションをさらによく理解し、処理できるようにすることを目指している」
この概念を形にするためのMicrosoft Concept Graphでは、機械学習アルゴリズムとして数十億のWebページと何年分もの匿名化された検索クエリから、2016年11月現在、540万件以上の概念を「知識グラフ」として抽出し、蓄積。それを継続的に拡充している。このような知識グラフは、産業界や学術界で「人間の思考をコンピュータ的にシミュレートしていく」ための研究/開発要素の1つとして期待されているという。
例えば、Microsoft Concept Graphの活用が見込まれる分野としては、検索広告(キーワード選択の支援)、検索サービス(精度の向上)、人間のようなチャットボットの開発などがある。
ヤン氏のチームはMicrosoft Concept Graphの開発に当たり、インデックスが作成されたWebページと検索クエリから、「such as ...」(〜などの)、「is a ...」(〜である)といった一般的なフレーズで結び付けられた言葉のつながりを抽出するように機械学習アルゴリズムを訓練した。例えば「犬」というインスタンスと「動物」という概念、あるいは「マイクロソフト」というインスタンスと「ソフトウェア会社」という概念のペアを選び出すという。
こうしたインスタンスと概念のペアを選別する処理は、Webページや検索クエリにおける登場頻度の分析に基づいて、より正しいと考えられるものが残されるようになっている。また、概念グラフの質を高めるために、インスタンスと概念のペアを人間がチェックするプロセスも設けている。
こうして抽出された数百万に上る概念には、「都市」や「ミュージシャン」といった一般的な単語から、「ウェディングドレスデザイナー」や「胃酸の分泌を抑える胸やけ治療薬」といったものまで含まれる。それぞれの概念が、ヒト/コト/モノなどの属性や、〜にある/〜の友人/〜の社長といった関係で一連のインスタンスと結び付けられる。
「I want to eat an apple」と「I want to visit Apple」は何が違うのか、をコンピュータに理解させるには
この他Microsoft Research Asiaは、Microsoft Concept Graphと関連する技術である「Microsoft Concept Tagging Model」も公開した。この技術は、インスタンスと概念を自動的に結び付けて、そのペアに確実性を示すスコア付けをすることで、コンピュータが人間のように概念化を行えるよう支援するもの。コンピュータ的に最も役立つ概念に高いスコアが与えられる。
例えば、「マイクロソフト」というインスタンスは、「企業」「ソフトウェア会社」「最大のOSベンダー」などいった概念と自動的に結び付けられる。この中では、「ソフトウェア会社」に最も高いスコアが付く。「最大のOSベンダー」の概念は1つのインスタンスしか当てはまらないが、「ソフトウェア会社」の概念はそれ以外のインスタンスにも当てはまるためだ。こうすることで、検索の実行や質問への回答といった意味論的計算を行うのに役立てている。
また、Microsoft Concept Tagging Modelは、インスタンスとともに使われる言葉のコンテキストを加味することで正確性を高めている。例えば、「I want to eat an apple」(リンゴを食べたい)という文章では、「apple」に関連付ける概念から「フルーツ」に高いスコアを付け、「I want to visit Apple」(アップル社を訪問したい)という文章では、「IT企業」の概念に高いスコアを付ける。
Microsoft Concept GraphとMicrosoft Concept Tagging Modelは、検索エンジン、チャットボット、その他のAI(Artificial Intelligence:人工知能)システムなどに向けた、「自然言語理解の研究」の支援を目的に公開したという。
この2つの技術は研究用にプレビュー版が公開されている。2016年11月現在のバージョンには、英語の概念データのコアバージョンが含まれる。将来のリリースで、テキストを理解するためのコンテキストを含む概念化技術や、中国語を始めとする他言語対応機能も用意するとしている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- マイクロソフトが「AIで主導権を握る」ために取る4つのアプローチとは
マイクロソフトが、総勢5000人以上のAI製品研究開発チーム「AI and Research Group」を設置。今後、同社が「AIで主導権を握る」ために注力する4分野も明らかにした。 - 女子高校生AI「りんな」や食べ物画像判定サービスに見る、精度向上の鍵とは
多くの人々にとって身近な存在になりつつある「人工知能」。「Microsoft Innovation Day 2016」で紹介された、2つのサービスを取り上げることで、要素技術や課題、応用分野、活用業種などを考察する。 - マイクロソフトは「セキュリティ」「管理」「イノベーション」で企業のデジタルトランスフォーメーションを強力に支援
日本マイクロソフトは2016年11月1〜2日の2日間、IT技術者向けのイベント「Microsoft Tech Summit」を開催。企業がデジタルトランスフォーメーションを実現していくための最新技術と実践的なノウハウを、100を超えるセッションで紹介。ここでは、初日に行われた基調講演の模様をレポートする。 - Recurrent Neural Networkとは何か、他のニューラルネットワークと何が違うのか
本連載では、Deep Learningの中でも、時系列データを扱うRecurrent Neural Networkについて解説。加えて、その応用方法として原稿校正(誤字脱字の検知)の自動化について解説します。