マイクロソフトは、非構造化データを分析して構造化データ抽出するAPI「Text Analytics API(プレビュー版)」を複数の言語で利用できるようアップデート。日本語にも対応した。
米マイクロソフトは2016年6月21日(米国時間)、構造化データ抽出API「Text Analytics API(プレビュー版)」を複数の言語で利用できるようアップデートしたと発表した。
Text Analytics APIは、アプリケーションに組み込むために視覚、音声、言語、知識といった知的情報の構造化を支援する「Cognitive Services」に含まれる、言語識別のためのAPI。人工知能アルゴリズムを用いた自然言語処理を行い、一般的な文章(非構造化データ)のテキストから、意味のある構造化データとして抽出できるという。センチメント分析(評価の分析)/重要なフレーズの抽出/トピックの検出などに対応している。
今回のアップデートによって、対応する言語が増えた。従来は120言語のテキストの言語検出と、英語文章のトピック検出のみ可能だったが、センチメント分析は英語/スペイン語/フランス語/ポルトガル語の4言語、重要フレーズの抽出は英語/スペイン語/ドイツ語/日本語に対応した。
Text Analytics APIの機能は、こちらのデモページで体験できる。
Copyright © ITmedia, Inc. All Rights Reserved.