Googleは2018年7月24日(米国時間)、年次イベント「Google Cloud Next ’18」で、GoogleCloud Platform(GCP)における認知系AIサービスの強化を発表した。Cloud AutoMLではテキスト分析と翻訳が追加。また、既存の認知系APIサービスにおける強化も発表された。
Googleは2018年7月24日(米国時間)、年次イベント「Google Cloud Next ’18」で、GoogleCloud Platform(GCP)における認知系AIサービスの強化を発表した。コーディングなしでカスタム機械学習モデルが構築できるCloud AutoMLでは、テキスト分析と翻訳が利用できるようになった。また、既存認知系APIサービスの強化も発表された。
Cloud AutoMLは、Googleが「専門家でなくとも利用できる」カスタムモデル構築サービスとして展開している、GCP上のサービスプロダクト。これまでは、画像認識/識別のCloud Vision APIに対応した「Cloud AutoML Vision」のみが提供されていた。ちなみにCloud AutoML Visionはこれまでアルファ版だったが、ベータ版に移行したという。
今回Googleは、Cloud AutoMLがCloud Natural Language APIとTranslation APIに対応することを発表した。
Cloud Natural Language APIはテキスト分析機能で、文章に含まれる人や場所の抽出、構文解析、感情分析、文書のカテゴリ分類などが行える。これをCloud AutoMLに適用した「AutoML Natural Language」では、ユーザー側の特定ニーズに基づく文書のカテゴリ分類を実行するモデルを、専門家でなくとも構築できる。一方、Translation APIをCloud AutoMLに適用した「AutoML Translation」では、ユーザー側が翻訳の教師データをアップロードして訓練を実行することにより、特定ニーズに合った自動翻訳を実現する。
AutoML Translationについては、日経グループが、日経新聞の日本語記事をNikkei Asian Review、Finantial Timesに掲載するため英語に翻訳することを目的として、試用しているようだ。
一方、認知系APIサービスの機能強化として、Googleは次の点を説明している。
Cloud Vision API(画像認識/識別/テキスト抽出)では、ファイルタイプとしてJPGに加え、TIFFとPDFに対応した。また、手書き文字にも対応したという。また、認識した物体が画像内のどこにあるのかを示せるようになった。
Cloud Text-to-Speech API(音声合成)では、文章を自動的に読み上げるスピーカーのタイプをカスタマイズできるようになったという。また、Cloud Speech-to-Text API(音声の文章化)では、言語の自動識別、話者の識別、複数チャネル録音への対応などを行ったという。
さらに、Googleは、ディープラーニング/AI処理のためにGCP上で提供しているCloud TPUについて、1ポッド(「ポッド」は複数のTPUユニットを相互接続した単位)当たり100PFLOPSを発揮するという「Cloud TPU 3.0」を、アルファ版として提供開始したという。
Copyright © ITmedia, Inc. All Rights Reserved.