2018年現在、グーグルはAI分野でどんな技術やサービスを提供しているのか? Google Cloud Next ’18 in Tokyoの基調講演から、AIに関する部分を書き起こした。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
ご注意:本記事は、@IT/Deep Insider編集部(デジタルアドバンテージ社)が「deepinsider.jp」というサイトから、内容を改変することなく、そのまま「@IT」へと転載したものです。このため用字用語の統一ルールなどは@ITのそれとは一致しません。あらかじめご了承ください。
グーグル主催のイベント「Google Cloud Next ’18 in Tokyo」(全2日間の1日目)が9月19日に開催された。
その基調講演の一部では、特に注力していく最先端テクノロジの分野の一つとしてAI(人工知能)が取り上げられた。本稿ではその内容を紹介する。以下は発表内容を独自に書き起こしたものである。
グーグルのミッションは情報を整理することですが、Google Cloudのミッションは情報を強化することです。そしてGoogle Cloud AIのゴールは、AIをシンプル(Simple)で高速(Fast)で利用しやすい(Useful)ものにすることです。これを皆さまのビジネスの問題を解決する一助にしたいと考えています。
ビッグデータを解析するためにはまず、データの複雑性を無くす必要があります。それにはいくつかの要件があります。
第一に、クラウドネイティブなデータウェアハウスを作ることです。これはつまり、数秒でデータをクエリできるようにし、何百万というストリーミングデータをリアルタイムで取り込めるようにすることです。次に、例えばApache Hadoop、Apache Sparkとったミドルウェア上でデータを処理して、そこから価値を得なければなりません。最後に、データを可視化して、Google Cloudとサードパーティのツールの上で、きちんとデータとしてのインサイトを生ませなければなりません。これはつまり、「データ分析や機械学習といったものを使いやすいものにする」ということです。
その中心にあるのがBigQueryです。これは、グーグルが完全に管理しているエンタープライズ・データ・ウェアハウスです。BigQueryは非常にユニークで、信じられないほど速く、膨大な量のデータセットを処理できます。
お客さまの中には、BigQueryの中にペタバイト(PB)級のデータ(1PB=HDのTV動画を13年分格納できる量)を入れて、5PB以上のクエリを行っている方もいます。
100のお客さまが1兆行以上のクエリを1回で行っています。また、28兆行のクエリを行った方もいらっしゃいます。
本当に膨大な量のデータですが、ではどうやったら、このデータからインテリジェンスが生み出せるのか? というと、それが機械学習となるわけです。
だからこそ、グーグルはBigQuery MLを導入しました。これにより、データ分析者やデータサイエンティストが非常にシンプルなSQLライクな構文を使うことによって、機械学習モデルを作れます(以下の図がその利用の流れです)。
機械学習をSQLライクなBigQuery MLにした理由は以下の3つです。
すでに以下のような顧客が使っています。
このようにデータ分析においてBigQuery MLは、あらゆる分野(金融、リテール、ゲーミング、メディア&エンターテイメントなど)で驚くような勢いがあります。例えばTwitterは、最も大きなHadoopクラスターを持っており、300PBのストレージを使っています。クラウドネイティブな会社から多くのエンタープライズ企業まで、わたしたちのツールが大きな差を生み出しています。
ところで、皆さんのデータはどうでしょうか?
実は、データの80%は非構造化データということが分かっています。例えば普通のドキュメント、写真、eメール、商品の評価や動画などは非構造化データです。
ここ5年間の深層学習(ディープラーニング)の発展によって、こういったものからインサイトを引き出せるようになりました。しかしディープラーニングは難しいです。ディープラーニングのモデルを本当の意味で作れる人材は、恐らく世界の中でも数万人程度だと思います。また、データサイエンティストは200万人ぐらいしかいません。デベロッパーに関しても2100万人ぐらいしか世界にはいません。
では、この状況を変えるにはどうすればいいでしょうか? グーグルは3つの分野で努力をしています。
(1)Google Cloud AI: GCPプラットフォーム
グーグルは、ここまでに説明したものも含めて、クラウドのプラットフォームを提供しています。皆さんがモデルを作って、走らせ、スケールさせられるプラットフォームです。
(2)Google Cloud AI: AIツール
またグーグルは、ビルディングブロックとしてAIツール(=クラウドのAPIサービス)を提供しています。これは、グーグルがこれまでに学習させたAIモデルです。
(3)Google Cloud AI: AIソリューション
さらにグーグルは、AIのソリューションも提供しています。皆さんがビジネスで抱えている問題を解決するためのものです。
それぞれについて詳しく説明していきます。
AIを使ううえでのコンピューティングに関する障壁を下げようとしています。
TPU
具体的には、クラウド上で提供するTPU(Tensor processing unit、GPUのようなグーグル独自のAI用演算処理装置)を使うことによって、機械学習の作業負荷を軽減できます。
例えばebayは、TPUを使うことによって、画像検索のトレーニング時間を100分の1にできました。つまり何カ月かかる作業が数日に短縮できたわけです。その結果、15%ほど精度を上げることにもつながりました。
最近(2018年5月)、第3世代のTPUを発表しました。これを使うことによって、さらにスピードや性能が上がっています。
Cloud Machine Learning Engine
データサイエンティストにとって、フレキシビリティが重要です。パフォーマンスも重要ですがロックインされても困ると考えています。そこでグーグルは、Cloud Machine Learning Engine(Cloud ML Engine)を発表しました。
Cloud ML Engineを使えば、皆さん方のAIモデルをGoogle Cloud上で使えるだけでなく、スケールも簡単です。また、TensorFlowやKeras、scikit-learnといった各種AIライブラリが使えます。
Kubeflow
さらにML(機械学習)に関しては、「オンプレミスとクラウドの両方にあるデータをシームレスに使えない」という問題が指摘されていました。これを解決するのがKubeflow(キューブフロー)です。
Kubeflowは、Kubernetes(=コンテナ化したアプリケーションのスケーリングやデプロイなどの運用自動化を行うためのオープンソースのプラットフォーム)の上に構築されたソフトウェアです。Kubeflowを使うと、Kubernetes上で機械学習スタックをシンプルかつ、ポータルブルで、スケーラブルに使えます。つまり、機械学習をオンプレミスとクラウドの間でシームレスに動かせるというわけです。
AIツールに関しては、次のようなビルディングブロックを提供しています。
ビルディングブロック(AIのAPIサービス)
具体的には、Vision(コンピュータービジョン)Natural Language(自然言語)、Text-to-Speech(スピーチ)、Translation(翻訳)、Video Intelligence(ビデオインテリジェンス)などを提供しています。これらのAPIサービスは、グーグルの既存製品からの良いとこ取りです。
これらのAPIを使えば、たった数行をコーディングするだけでAIが使えます。
事例として例えばSansanでは次のようにCoud Vision APIが活用されています。
また、丸紅情報システムのmsys Omnis(エムシス・オムニス)では次のようにCoud Translation APIやCloud Text-to-Speech APIが活用されています。
Cloud AutoML(カスタムのAIサービス)
しかしながら、現場のAI活用では、マス・カスタマイゼーション(=最適な特注品を作ること)の課題があります。例えば2社がまったく同じように見える問題を抱えていたとしても、問題の性質は各社違っており、結局は会社ごとに別々のAIモデルが必要になってくるということです。では、どうやって各社にあったカスタムのAIモデルを作ればよいでしょうか?
これを解決する方法としてCloud AutoML(クラウド・オート・エム・エル)を提供しています。
Cloud AutoMLは最強の機械学習サービスだと思います。皆さんの課題に特化した機械学習モデルを作成でき、しかもコードもほとんど書く必要がないからです。これによって、誰もがAIをうまく使いこなせます。
最初のCloud AutoMLのリリースはAutoML Visionでした。これは、Cloud AutoMLのVisionサービスを、まったく新しい画像認識サービスにカスタマイズできます。AutoML Visionを使うことで、例えば皆さんが製造業の工場製品に欠陥があるかどうかを画像認識するための独自のAIサービスを作成できます。カスタマイズに必要な画像も数十枚ぐらいで、時間も数分程度です。
2つ目がAutoML Natural Languageです。テキスト分析が行える自然言語サービスをカスタマイズできます。例えば皆さんの業務に特化した独自の情報分析・情報理解がテキストから行えるようになります。
3つ目がAutoML Translationです。これは、グーグルの機械翻訳の技術をカスマイズできます。これも、専門用語や言葉のニュアンスや比喩を解釈するなど、対象に特化した翻訳が行えるようになるわけです。現時点で27の言語ペアがありますが、今後さらに増えていきます。
AutoML Visionのデモを行います(以下の画像のとおり)。
加えて、AutoML Translationのデモも行います(以下の画像のとおり)。
AutoML Translationの事例として、日経新聞社でも以下の事例があります。
このように精度の高いカスタムのAIモデルを簡単にすぐに作れます。さまざまなビルディングブロックをうまく組み合わせることによって、多種多様な問題解決が可能です。
ここまでに説明してきたGoogle Cloud AIは、1万4000以上の優良顧客がすでに使用中です。
最後に、AIによるソリューションついて紹介していきます。
グーグルのAIを、パートナー企業の製品や既存のワークフローに組み込んでいただくことに取り組んでいます。その最たる事例がContact Center AIです。
グーグルの会話・自然言語のAIを組み込んだ、お客さまの質問に自動対応できるソリューションです。2018年初に発表しました。簡単な質問回答だけでなく、Contact Centerのエージェントに情報を与えることで複雑な質問に対してもインテリジェントな回答をすることも可能になります。
もう一つ、よくある課題が「文章理解」です。どういう形で大量の文章から正しいナレッジを獲得していけばよいのでしょうか? そこで、Iron Mountainと協業しました。
Iron Mountainは、1.7兆ページの文章を管理しています。AIの力で、これらの大量の文章に対してOCRによる文字認識から文書理解までをシームレスに行っています。フォーチュン1000社の95%をサポートしており、このテクノロジにすでにアクセスできるようになっています。2018年以降、グーグルではこのテクノロジをより多くの他の企業にも利用できるようにしたいと考えています。
「小売り、メディア、金融、製造業など、各社のニーズがどこにあるのか」「どのような形で解決できるのか」という観点で主要業界に特化したAIに発展させながら、できるだけ多くの企業にお使いいただけるようにしていきます。
ここまにご紹介したすべての内容で、グーグルがいかにデータとAIを簡単に速く使いやすくしているのかがお分かりいただけたと思います。
皆さま、これはまだ初期段階です。次の画像を見てください。皆さん、覚えていらっしゃいますか?
これは1994年のMosaicのブラウザーです。多くの人が、これでインターネットを初めて見て体験しました。そこで多くの人にひらめきをもたらしました。わたしはスポーツが大好きなので生中継のサイトから見られるようになったのは本当に素晴らしいと思いました。
いまAIは、これと同じような黎明期にあるということです。2018年現在、インターネット時代の2014年と同じく、わたしたちはAIの重要なスタートポイントに立っています。次の30年間でAIは、大きなコンピューティング演算力の土台・礎になるのは間違いありません。ぜひ皆さんと一緒に開発し、その時代を現実のものにしていきたいと思っています。
Copyright© Digital Advantage Corp. All Rights Reserved.