グーグルのAI技術、2018年9月最新情報 ― Google Cloud Next ’18 in Tokyo 基調講演レポート：イベントから学ぶ最新技術情報

2018年現在、グーグルはAI分野でどんな技術やサービスを提供しているのか？ Google Cloud Next ’18 in Tokyoの基調講演から、AIに関する部分を書き起こした。

» 2018年09月19日 05時00分公開

[一色政彦，デジタルアドバンテージ]

この記事は会員限定です。会員登録（無料）すると全てご覧いただけます。

ご注意：本記事は、＠IT／Deep Insider編集部（デジタルアドバンテージ社）が「deepinsider.jp」というサイトから、内容を改変することなく、そのまま「＠IT」へと転載したものです。このため用字用語の統一ルールなどは＠ITのそれとは一致しません。あらかじめご了承ください。

　グーグル主催のイベント「Google Cloud Next ’18 in Tokyo」（全2日間の1日目）が9月19日に開催された。

　その基調講演の一部では、特に注力していく最先端テクノロジの分野の一つとしてAI（人工知能）が取り上げられた。本稿ではその内容を紹介する。以下は発表内容を独自に書き起こしたものである。

基調講演のAI関連部分の書き起こし

Google Cloud AI,Rajen Sheth（ラジェン・シェス）氏、Director of Product Management, Google Cloud AI

　グーグルのミッションは情報を整理することですが、Google Cloudのミッションは情報を強化することです。そしてGoogle Cloud AIのゴールは、AIをシンプル（Simple）で高速（Fast）で利用しやすい（Useful）ものにすることです。これを皆さまのビジネスの問題を解決する一助にしたいと考えています。

Google Cloud AIのゴール： Simple、Fast、Useful

ビッグデータ解析のためのクラウド

ビッグデータ解析のためのクラウド

　ビッグデータを解析するためにはまず、データの複雑性を無くす必要があります。それにはいくつかの要件があります。

　第一に、クラウドネイティブなデータウェアハウスを作ることです。これはつまり、数秒でデータをクエリできるようにし、何百万というストリーミングデータをリアルタイムで取り込めるようにすることです。次に、例えばApache Hadoop、Apache Sparkとったミドルウェア上でデータを処理して、そこから価値を得なければなりません。最後に、データを可視化して、Google Cloudとサードパーティのツールの上で、きちんとデータとしてのインサイトを生ませなければなりません。これはつまり、「データ分析や機械学習といったものを使いやすいものにする」ということです。

　その中心にあるのがBigQueryです。これは、グーグルが完全に管理しているエンタープライズ・データ・ウェアハウスです。BigQueryは非常にユニークで、信じられないほど速く、膨大な量のデータセットを処理できます。

　お客さまの中には、BigQueryの中にペタバイト（PB）級のデータ（1PB＝HDのTV動画を13年分格納できる量）を入れて、5PB以上のクエリを行っている方もいます。

5PB以上のクエリ

　100のお客さまが1兆行以上のクエリを1回で行っています。また、28兆行のクエリを行った方もいらっしゃいます。

28兆行のクエリ

　本当に膨大な量のデータですが、ではどうやったら、このデータからインテリジェンスが生み出せるのか？というと、それが機械学習となるわけです。

BigQuery ML

　だからこそ、グーグルはBigQuery MLを導入しました。これにより、データ分析者やデータサイエンティストが非常にシンプルなSQLライクな構文を使うことによって、機械学習モデルを作れます（以下の図がその利用の流れです）。

膨大なデータ

▼

エクスポートされたデータ

▼

BigQuery ML

▼

Step 1：モデル作成

▼

モデルを作成するためのクエリ実行

▼

Step 2：予測

▼

予測するためのクエリ実行

　機械学習をSQLライクなBigQuery MLにした理由は以下の3つです。

シンプル： SQLは多くの人が理解し、使い慣れた言語であること
データベース内蔵： データベースの中からアクセスできること
高速： 機械学習のモデルを30秒以内に作り上げて、それをビジネスの中ですぐに使えること

　すでに以下のような顧客が使っています。

BigQuery MLのカスタマー事例

　このようにデータ分析においてBigQuery MLは、あらゆる分野（金融、リテール、ゲーミング、メディア＆エンターテイメントなど）で驚くような勢いがあります。例えばTwitterは、最も大きなHadoopクラスターを持っており、300PBのストレージを使っています。クラウドネイティブな会社から多くのエンタープライズ企業まで、わたしたちのツールが大きな差を生み出しています。

ディープラーニングへの取り組み

　ところで、皆さんのデータはどうでしょうか？

　実は、データの80％は非構造化データということが分かっています。例えば普通のドキュメント、写真、eメール、商品の評価や動画などは非構造化データです。

80％は非構造化データ

　ここ5年間の深層学習（ディープラーニング）の発展によって、こういったものからインサイトを引き出せるようになりました。しかしディープラーニングは難しいです。ディープラーニングのモデルを本当の意味で作れる人材は、恐らく世界の中でも数万人程度だと思います。また、データサイエンティストは200万人ぐらいしかいません。デベロッパーに関しても2100万人ぐらいしか世界にはいません。

　では、この状況を変えるにはどうすればいいでしょうか？グーグルは3つの分野で努力をしています。

（1）Google Cloud AI： GCPプラットフォーム

GCPプラットフォーム

　グーグルは、ここまでに説明したものも含めて、クラウドのプラットフォームを提供しています。皆さんがモデルを作って、走らせ、スケールさせられるプラットフォームです。

（2）Google Cloud AI： AIツール

AIツール

　またグーグルは、ビルディングブロックとしてAIツール（＝クラウドのAPIサービス）を提供しています。これは、グーグルがこれまでに学習させたAIモデルです。

（3）Google Cloud AI： AIソリューション

　さらにグーグルは、AIのソリューションも提供しています。皆さんがビジネスで抱えている問題を解決するためのものです。

AIソリューション

　それぞれについて詳しく説明していきます。

（1）Google Cloud AI： GCPプラットフォーム

　AIを使ううえでのコンピューティングに関する障壁を下げようとしています。

TPU

　具体的には、クラウド上で提供するTPU（Tensor processing unit、GPUのようなグーグル独自のAI用演算処理装置）を使うことによって、機械学習の作業負荷を軽減できます。

Cloud TPU

　例えばebayは、TPUを使うことによって、画像検索のトレーニング時間を100分の1にできました。つまり何カ月かかる作業が数日に短縮できたわけです。その結果、15％ほど精度を上げることにもつながりました。

　最近（2018年5月）、第3世代のTPUを発表しました。これを使うことによって、さらにスピードや性能が上がっています。

第3世代のTPU

Cloud Machine Learning Engine

　データサイエンティストにとって、フレキシビリティが重要です。パフォーマンスも重要ですがロックインされても困ると考えています。そこでグーグルは、Cloud Machine Learning Engine（Cloud ML Engine）を発表しました。

Cloud Machine Learning Engine

　Cloud ML Engineを使えば、皆さん方のAIモデルをGoogle Cloud上で使えるだけでなく、スケールも簡単です。また、TensorFlowやKeras、scikit-learnといった各種AIライブラリが使えます。

Kubeflow

　さらにML（機械学習）に関しては、「オンプレミスとクラウドの両方にあるデータをシームレスに使えない」という問題が指摘されていました。これを解決するのがKubeflow（キューブフロー）です。

kubeflow

　Kubeflowは、Kubernetes（＝コンテナ化したアプリケーションのスケーリングやデプロイなどの運用自動化を行うためのオープンソースのプラットフォーム）の上に構築されたソフトウェアです。Kubeflowを使うと、Kubernetes上で機械学習スタックをシンプルかつ、ポータルブルで、スケーラブルに使えます。つまり、機械学習をオンプレミスとクラウドの間でシームレスに動かせるというわけです。

（2）Google Cloud AI： AIツール

　AIツールに関しては、次のようなビルディングブロックを提供しています。

ビルディングブロック（AIのAPIサービス）

AIツール

　具体的には、Vision（コンピュータービジョン）Natural Language（自然言語）、Text-to-Speech（スピーチ）、Translation（翻訳）、Video Intelligence（ビデオインテリジェンス）などを提供しています。これらのAPIサービスは、グーグルの既存製品からの良いとこ取りです。

　これらのAPIを使えば、たった数行をコーディングするだけでAIが使えます。

AIサービスにようる問題解決のサポート

　事例として例えばSansanでは次のようにCoud Vision APIが活用されています。

Coud Vision API（Sansanの活用事例）

　また、丸紅情報システムのmsys Omnis（エムシス・オムニス）では次のようにCoud Translation APIやCloud Text-to-Speech APIが活用されています。

Coud Translation／Text-to-Speech API（丸紅情報システムの活用事例）

Cloud AutoML（カスタムのAIサービス）

　しかしながら、現場のAI活用では、マス・カスタマイゼーション（＝最適な特注品を作ること）の課題があります。例えば2社がまったく同じように見える問題を抱えていたとしても、問題の性質は各社違っており、結局は会社ごとに別々のAIモデルが必要になってくるということです。では、どうやって各社にあったカスタムのAIモデルを作ればよいでしょうか？

　これを解決する方法としてCloud AutoML（クラウド・オート・エム・エル）を提供しています。

Cloud AutoML

　Cloud AutoMLは最強の機械学習サービスだと思います。皆さんの課題に特化した機械学習モデルを作成でき、しかもコードもほとんど書く必要がないからです。これによって、誰もがAIをうまく使いこなせます。

　最初のCloud AutoMLのリリースはAutoML Visionでした。これは、Cloud AutoMLのVisionサービスを、まったく新しい画像認識サービスにカスタマイズできます。AutoML Visionを使うことで、例えば皆さんが製造業の工場製品に欠陥があるかどうかを画像認識するための独自のAIサービスを作成できます。カスタマイズに必要な画像も数十枚ぐらいで、時間も数分程度です。

AutoML（Vision／Natural Language／Translation）

　2つ目がAutoML Natural Languageです。テキスト分析が行える自然言語サービスをカスタマイズできます。例えば皆さんの業務に特化した独自の情報分析・情報理解がテキストから行えるようになります。

　3つ目がAutoML Translationです。これは、グーグルの機械翻訳の技術をカスマイズできます。これも、専門用語や言葉のニュアンスや比喩を解釈するなど、対象に特化した翻訳が行えるようになるわけです。現時点で27の言語ペアがありますが、今後さらに増えていきます。

Cloud Platform,Kaz Sato（カズ・サトウ）氏、Developer Adovocate, Cloud Platform

　AutoML Visionのデモを行います（以下の画像のとおり）。

データ

▼

訓練（20分）

▼

評価

▼

予測

　加えて、AutoML Translationのデモも行います（以下の画像のとおり）。

ドメイン特有にカスタマイズする必要性

▼

以下の事例について

▼

データ

▼

訓練（23時間）

▼

予測（1）：右上がカスタマイズ版の翻訳、右下がオリジナル版の翻訳

▼

予測（2）：右上がカスタマイズ版の翻訳、右下がオリジナル版の翻訳

　AutoML Translationの事例として、日経新聞社でも以下の事例があります。

AutoML Translationの事例（日経新聞社）

　このように精度の高いカスタムのAIモデルを簡単にすぐに作れます。さまざまなビルディングブロックをうまく組み合わせることによって、多種多様な問題解決が可能です。

（3）Google Cloud AI： AIソリューション

　ここまでに説明してきたGoogle Cloud AIは、1万4000以上の優良顧客がすでに使用中です。

Google Cloud AIを利用中のカスタマー例

　最後に、AIによるソリューションついて紹介していきます。

AIソリューション応用

　グーグルのAIを、パートナー企業の製品や既存のワークフローに組み込んでいただくことに取り組んでいます。その最たる事例がContact Center AIです。

Contact Center AI

　グーグルの会話・自然言語のAIを組み込んだ、お客さまの質問に自動対応できるソリューションです。2018年初に発表しました。簡単な質問回答だけでなく、Contact Centerのエージェントに情報を与えることで複雑な質問に対してもインテリジェントな回答をすることも可能になります。

　もう一つ、よくある課題が「文章理解」です。どういう形で大量の文章から正しいナレッジを獲得していけばよいのでしょうか？そこで、Iron Mountainと協業しました。

「文章の理解」の事例（Iron Mountain）

　Iron Mountainは、1.7兆ページの文章を管理しています。AIの力で、これらの大量の文章に対してOCRによる文字認識から文書理解までをシームレスに行っています。フォーチュン1000社の95％をサポートしており、このテクノロジにすでにアクセスできるようになっています。2018年以降、グーグルではこのテクノロジをより多くの他の企業にも利用できるようにしたいと考えています。

　「小売り、メディア、金融、製造業など、各社のニーズがどこにあるのか」「どのような形で解決できるのか」という観点で主要業界に特化したAIに発展させながら、できるだけ多くの企業にお使いいただけるようにしていきます。

主要業界に特化したAI

次世代「AI時代」に向けて

　ここまにご紹介したすべての内容で、グーグルがいかにデータとAIを簡単に速く使いやすくしているのかがお分かりいただけたと思います。

簡単に、速く、使いやすく

　皆さま、これはまだ初期段階です。次の画像を見てください。皆さん、覚えていらっしゃいますか？

Mosaic

　これは1994年のMosaicのブラウザーです。多くの人が、これでインターネットを初めて見て体験しました。そこで多くの人にひらめきをもたらしました。わたしはスポーツが大好きなので生中継のサイトから見られるようになったのは本当に素晴らしいと思いました。

　いまAIは、これと同じような黎明期にあるということです。2018年現在、インターネット時代の2014年と同じく、わたしたちはAIの重要なスタートポイントに立っています。次の30年間でAIは、大きなコンピューティング演算力の土台・礎になるのは間違いありません。ぜひ皆さんと一緒に開発し、その時代を現実のものにしていきたいと思っています。

「AI・機械学習のイベントレポート」