AWSの機械学習／ディープラーニングサービス、新たな展開とは：AWS re:Invent 2017、大量発表の文脈（1）（2/2 ページ）

» 2017年12月06日 05時00分公開

AWS DeepLensで、ディープラーニングを開発者に親しみやすく

DeepLensでは、画像処理を通じてディープラーニングを学べる

　DeepLensは、Intel AtomにHDカメラ、マイクを搭載したボックス。re:Invent 2017のワークショップ参加者には無料で配布した。米国での販売開始を2018年4月に予定しており、Amazon.comでは事前予約ができるようになっている。価格は249ドル。

　ソフトウェアとしては、AWSがエッジコンピューティング用のソフトウェアとして推進している「AWS Greengrass」を搭載。すなわち「AWS Lambda」のサーバレスコンピューティング機能を動かせる。

　DeepLensはまた、MXNetの推論エンジンを搭載。SageMakerなどを使ってAWSで構築したモデルを、同デバイスに適用して実行できる。AWSではこのデバイスに最適化したMXNetを搭載しているが、他のフレームワークを使うこともできるとしている。

　「コンピュータービジョンは単純に言って楽しい」。機械学習に親しむプログラマーを増やすために、カメラ搭載ボックスを提供する理由について、ウッド氏はこう話した。

　DeepLensでは、必ずしも最初から、SageMakerを使ったディープラーニングに直接取り組む必要はない。各種のプロジェクトテンプレートが用意されていて、訓練済みのモデルを適用することもできるという。DeepLensの紹介ページには、「猫・犬の検知」「物体認識」「顔認識」「ホットドッグ検知」などが、こうしたテンプレートとして紹介されている。

　DeepLensは上記の通り、機械学習を楽しく学んでもらうことを主な目的としている。だが、当然ながら画像を対象とした機械学習を活用するサービスで、即座に開発を始め、PoC（Proof of Concept）を行うためにも使える。

AWS Greengrass ML Inferenceでエッジコンピューティングに対応

　IoTを機械学習と組み合わせるケースが増えている。特に日本では、不良検査や故障予測、監視の自動化などに生かす例がよく聞かれるようになってきた。

　今回のre:Inventでは、こうしたユースケースへの迅速な対応を支援する目的で、Greengrass ML Inferenceがプレビュー版として発表された。Greengrassにローカルでの推論エンジン実行機能を付加したもので、前述のDeepLensも、「Greengrass ML Inferenceを搭載している」と表現できる。

　Greengrassは、幅広いエッジコンピューティングデバイスにインストールできるソフトウェアで、デバイス上でLambda関数を動かし、AWSのサービスとつなげて利用できる。IoTで、ローカルな処理が必要なケースに適している。

　今回発表のGreengrass ML Inferenceは、これにMXNetのエンジンを付加するもの。NVIDIA Jetson、Intel Apollo Lake、Raspberry Piのそれぞれに最適化されたMXNetパッケージを、デバイスにダウンロードしで動かせるという。

　Greengrass ML Inferenceでは、Greengrassコンソールで、SageMakerによって構築・訓練されたモデルを直接ダウンロードして適用できる。

コグニティブ系APIでは、Alexaとも連動して世界を広げつつある

　AWSは2016年のre:Inventで、画像解析の「Amazon Rekognition」、テキストを音声に変換する「Amazon Polly」、そしてPollyを活用した自動音声認識／自然言語認識アプリケーションオーサリング環境の「Amazon Lex」を発表した。

　Re:Invent 2017では、ビデオ解析の「Amazon Rekognition Video」、音声をテキスト化する「Amazon Transcribe」、テキスト翻訳の「Amazon Translate」、文章から特徴を抽出する「Amazon Comprehend」を発表した。

　Rekognition Videoでは、ビデオ中の物体や人物を検知・分類したり、シーンの不適切度を示したりできる。「不適切度が80％以上のシーンは削除する」などと決めて、ビデオの不適切コンテンツに関する編集作業を自動化するのに使える。人物の追跡も可能で、撮影済みの動画に加え、ライブビデオ（ストリーミングビデオ）に対応しているため、監視カメラによる不正の追跡にも使える。なお、Amazon Rekognitionもre:Inventの約1週間前、2017年11月下旬に機能強化された。イメージ内のテキストの検出と認識、数千万の顔からのリアルタイム顔認識、密集写真からの最大100個の顔検出ができるようになった。

　Transcribeは、段落分けを自動で行うという。一般的な音声に加え、電話音声に対応するため、Amazon Connectの録音機能と組み合わせ、コールセンターで使うこともできそうだ。

　Comprehendは、テキストデータからキーフレーズを抽出したり、トピック分析、エンティティ分析、センチメント分析（感情分析）を行ったりできる。SNSのポストにも対応する。キーフレーズの例として、AWSでは「warm」「sunny」「beautiful」などを挙げている。

Comprehendは、文章から特徴的な言葉を抜き出し、分類して示せる

　音声認識APIおよび音声合成APIの基となっているのは、Alexa搭載デバイス向けのサービス。関連してAWSは今回、職場でのAlexa活用を促進するため、Alexa for Businessを発表した。

　Alexa for Businessでは、各ユーザーの個人用アカウントと職場用アカウントを、分離しながら連動できる。そして職場用アカウントは、企業が管理できる。その上で各ユーザーは、音声による命令で、ビデオ会議を開始したり、会議室を予約したり、Alexaデバイスをスピーカーフォンとして使って、電話をしたりできる。受付で来訪者に対応するロボットの開発も、適用例の1つとして挙げている。

　Alexaを搭載しAmazon Echoには、スピーカー／マイクだけでなく、カメラを搭載した製品出てきている。今後、Amazonは画像系のAPIも活用するSkillの開発を促す活動を進める可能性がある。

　こうしてAWSは、Alexaを通じてAmazonが構築したエコシステムを、さらに幅広いディープラーニングソリューションの構築・提供につなげようとしている。

前のページへ 1|2 　　　　　　

SpecialPR