Microsoft、「人間のように文書を読んだり、質問に答えたり」するAIを開発:SQuADデータセットの読解力スコアでAlibabaと首位争い
Microsoft Research Asiaが開発したAI技術が、人間並みの読解力スコアを記録した。
Microsoftは2018年1月15日(米国時間)、同社の研究者が人工知能(AI)を使って、人間のように文書を読んだり、質問に答えたりする技術を開発したと発表した。
これは、「『Bing』のような検索エンジンや、『Cortana』のようなインテリジェントアシスタントが、人々がコミュニケーションを行うように、より自然に人とやりとりして情報を提供する取り組みにおける大きなマイルストーンだ」とMicrosoftは述べている。
この技術は、Microsoft Research Asiaが「Stanford Question Answering Dataset」を使って開発した。これは、Wikipediaの記事に関する一連の質問から成る「マシンリーディング(機械読解)データセット」で、研究者の間では「SQuAD」の略称で知られている。
研究機関がSQuADを使って達成した読解力の精度を記録しているSQuADリーダーボードによると、Microsoftは2018年1月3日、質問と回答の完全一致において「82.650」のスコアを達成したモデルを提出した。同じ質問と回答のセットでの人間のスコアは、「82.304」だ。中国の電子商取引企業Alibabaも1月5日、「82.440」のスコアを記録したモデルを提出している。
Microsoftは、SQuADリーダーボードに提出したモデルの早期バージョンを既にBingに適用しており、より複雑な問題への適用にも取り組んでいる。
例えば、Microsoftは、コンピュータが最初の質問だけでなく、以降の関連する質問にも答えられるように取り組んでいる。具体的には、「ドイツの首相が生まれた年は何年?」と尋ねた後に、「彼女が生まれた市は?」と尋ねた場合に、同じ話題であることを理解できるようにすることだ。
またMicrosoftは、コンピュータが、複数の文章からの情報を必要とする自然な答えを返せるようにすることにも目を向けている。これは、「ジョン・スミスは米国市民?」という質問に対し、「ジョン・スミスはハワイで生まれました。この州は米国内にあります」と答えられるようにすることだ。
Microsoftは、人々が簡単かつ直感的に操作できる技術を生み出す研究の一環として、マシンリーディングに多額の投資を行っている。例えば、Microsoftの検索エンジンBingは、検索キーワードに応じてリンクのリストを返すだけにとどまらず、はっきりした説明文で答えを返したり、複雑なトピックや議論のあるトピックでは複数の情報ソースを返したり、といった方向に向かおうとしている。
研究者は、マシンリーディングにより、コンピュータが書籍や書類に含まれる情報を高速に解析し、人々が必要とする情報を理解しやすい形で提供できるようになる、と考えている。
そうなれば、ドライバーは車の分厚いマニュアルの中から必要な情報を簡単に見つけ出せるようになり、切迫した、あるいは困難な状況で時間や手間を節約できる。また、医師や弁護士などの専門家はこうしたツールにより、特定の医学的発見や判例に関する大量の書類に目を通すような骨の折れる作業を、高速に処理できる可能性がある。さらに、そうして得た知識を患者の治療や法律意見書の作成に応用できるようになるかもしれない。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- マイクロソフト、ディープラーニング研究開発企業のマルーバを買収へ
マイクロソフトが、自然言語理解におけるディープラーニング研究のスタートアップであるマルーバを買収で合意。「AIの民主化」を推進する。 - マイクロソフト、AI研究者向けに“10万件”のデータセット「MS MARCO」を無償公開
マイクロソフトが、AIシステムの訓練に使える10万件のデータセット「MS MARCO」を公開した。匿名化された実際のデータを使った質問と回答のセットが含まれ、AIを用いた認知システムの開発を支援できるという。 - 「AI」「機械学習」「ディープラーニング」は、それぞれ何が違うのか
「AI」「機械学習」「ディープラーニング」は、それぞれ何が違うのか。GPUコンピューティングを推進するNVIDIAが、これらの違いを背景および技術的要素で解説した。