連載
» 2014年07月04日 18時00分 公開

無双! Fire Phone発表に見るAmazonの強さドリキンが斬る!(9)(2/3 ページ)

[ドリキン,@IT]

Amazonサービスとの連携

 次に紹介されたのがAmazonのサービス連携についてです。

 Fire Phoneを購入すると(初期購入者限定で)Amazon Primeの1年分の会費が無料になります。このためFire Phoneを手に入れた瞬間から、実質的にAmazonビデオとミュージックの膨大なライブラリにアクセスすることができます。

 Amazonビデオもミュージックも、NetflixやSpotifyといった他社の単独サービスと比べるとまだまだコンテンツ力は弱いのですが、それでも十分なコンテンツ量を備えていますし、Amazonは精力的にコンテンツを増やしています。なにせPrimeに加入していれば、大半のコンテンツは無料で楽しめます。

 後述するFirefly機能を利用すると、Fire TVで観ているテレビドラマをFire Phoneで認識し、番組や出演者の情報を得るというデバイス連携も可能です。Fireflyの認識機能では、単に見ている番組を認識するだけでなく、認識させたときの再生位置なども理解して、そのシーンにおける登場人物の情報を提供するなど、膨大なメタデータを武器に差別化しているあたりにも感心させられました。

身の回りのあらゆるものを物販につなげてしまうFirefly機能

 さて、ここまででも十分話が長くなってしまいましたが、いよいよFire PhoneにおけるAmazon独自技術、「Firefly」機能の発表に移ります。

 Fireflyは、簡単に言えば、実世界における身の回りのあらゆるものをAmazonの物販につなげてしまうというサービスです。

 Fire Phoneのサイドには、音量ボタンと並んでFireflyを呼び出す専用のボタンが備わっていて、このボタンを押すだけでいつでもFirefly機能が呼び出せます。

 Fireflyが起動すると、実世界を認識するためのカメラとマイクが動き出します。ベゾス氏は、テーブルに並べられたCDやら書籍、食品の缶詰めなどあらゆるものをカメラで認識させるというデモを行い、一度の認識ミスもなく、次々と10個の商品認識デモを成功させました。

 すごいのはFireflyの画像認識技術です。バーコードやQRコードを認識するだけでなく、ジャケット写真など、商品の一部を撮影するだけでも高い精度でモノを認識できるとのこと。さらには、今流れている音楽やテレビ番組などの情報も、マイクから音声を拾って認識させるなど、カメラとマイクの認識を同時に行えるのも特徴です。

 iPhoneやAndroidでも同様のことができるアプリは既にたくさんあるのですが、認識率の高さと、何といっても複数の認識エンジンをFife Fly機能に集約させ、専用ボタン一つでユーザーが対象や手段を意識することなく商品を検索できる、というのが最大の特徴でしょう。

 FireflyはAmazonの商品を検索すると説明しましたが、実際には認識できるのはAmazon上のコンテンツだけではありません。

 他社のサービスやなどとも簡単に連携できます。この辺りはAndroidの柔軟なシステムを最大限に生かしている感じです。ベゾス氏は、今回、事前に開発を依頼したサードパーティーのデベロッパーは一日で既存アプリをFireflyに対応できたことを強調していました。

 複雑な認識エンジンについてはAmazonの開発するエンジンを使い、その結果だけを自社のサービスに流し込むだけなので、確かに実装はかなり簡単そうです。デベロッパーはAmazonの成果を最大限に利用して自身のアプリを拡張できるので、デベロッパーのメリットも大きいと思います。うまくエコシステムが活性化すれば、Fire Phoneの一つの優位性につながる可能性を秘めています。

24時間365日サポートのMayday機能

 もう一つ、Amazonの顧客志向を体現している機能が「Mayday」と名付けられた24時間365日対応の有人サポート機能です。

 画面を上から下にスワイプすると出てくるノーティフィケーションメニューに常駐している「Maydayボタン」をタップすると、いつでも15秒以内にカスタマーサポートにつながって、使い方やトラブル解決方法を教えてくれるというものです。

 これは日本のサービスレベルから考えてもかなりすごいことだと想像できるかと思います。ましてや、米国のカスタマーサービスレベルで考えたらとんでもないことだと思います。

 経験上、カスタマーサポートに電話をして、最初から有人で対応されることはほとんどなく、大抵は自動応答にたらい回しにされ、何とかサポートにつながったらラッキーだけれど、その前に面倒くさくなって諦めてしまう……というのが日常茶飯事な中、本当にうたい文句通りにサポートが受けられるとしたら、とても大きな差別化になると思います。

 SiriやGoogle Nowが、音声認識+クラウドで何とかこのようなサポートを自動化しようと力を注いでいる中、それを人力で実現してしまうあたりがさすがAmazonと思ってしまいました。

Fire Phone最大の目玉機能、ダイナミックパースペクティブ

 大変お待たせ致しました。ここからがFire Phone最大の機能であり、今回の発表の目玉であった新機能、「ダイナミックパースペクティブ」の紹介です。

 ダイナミックパースペクティブとは、Fire Phone前面の四隅に配置された、4つのカメラを利用して顔の位置や角度を検出するAmazon独自技術の名称です。

 発表はまずエジプトの壁画から始まります。

 ベゾス氏は、「遠近法が発明される以前の絵は奥行きを表現することができなかった。しかし遠近法が開発されたことにより、絵の中の情報量が増え、表現が豊かになった」という歴史を紹介しました。

 しかしそれ以降、現代に至るまで2D技術の革新がなく、絵はどの方面からみても同一視点の情報しか得られません。

 しかし、現実の3D世界には奥行きという概念があります。ある位置から見えた景色が、ちょっと頭を動かして視点を変えただけで、見た目も見えるものの情報量も変わってきます。

 このギャップを埋めようとしているのが、ダイナミックパースペクティブの技術です。

 これは、画面とそれを見ている人の頭の位置を検出し、その相対的な位置関係や動きに連動して画面上の表示内容を変えるという技術です。これを実現するためには、頭の位置情報を正確に検出する認識技術と、そのデータを正確に画面上に反映させるソフトウェア技術の両方が必要になります。

 後者の表示技術自体は、開発の手間が増えるという問題はあるにせよ、3D的に奥行きを表現する技術自体は一般化しています。やはり難しいのは、前者の位置情報認識技術です。

 カメラなどを使って人やモノの位置を検出する技術は既に実用化されていて、最近ではマイクロソフトのKinectやPlayStationのPS Moveなど、同様の技術が実際の製品としても世の中に出回っています。またSamsungなども、フロントカメラを利用して顔や手を認識することでスマホをコントロールする機能を自社のAndroidスマホに搭載しています。

 しかし正直、どの技術も製品も従来の操作方法を完全に置き換えることはできていません。スマホでいえばタッチ操作+α、おまけ程度の機能に留まっていて、「これがないと困る」というほど依存して使っている人を周りで見たことがありません。

 その一番の理由は、やっぱり精度の問題だと思います。この手の技術は、うまくいくときには従来の操作よりも圧倒的に効率良く物事をこなせるのですが、大抵は精度が低く、さらに失敗したときのペナルティが従来の操作方法に比べて格段に高いことが問題です。

 個人的には、音声認識がなかなか普及しない理由もここにあると思っています。うまく音声を認識してくれたときはタイピングに比べても圧倒的に効率が良くて快適ですが、ちょっとでも誤認識されると使う気をなくすし、その間違いを修正するコストが高過ぎます。なので、大抵は途中で諦めて、「だったら最初からキーボードで入力しよう」ということになってしまいます。

 話をダイナミックパースペクティブに戻しますと、Amazonはこの辺りにかなり時間とリソースを費やしてこの技術を開発したと力説しています。

 通常、物体の位置と奥行きを認識するには2つのカメラがあれば十分です。実際ダイナミックパースペクティブでも、認識に必要なカメラは最低限2つのようです。じゃあ、なぜ本体前面の四隅に4つのカメラが必要かというと、「あらゆる状況で正確に認識するためだ」と説明されています。

 カメラが2つしかないと、持ち方や向きによってはカメラがふさがれてしまったり、精度の高いデータが取得できない可能性があります。通常、スマホの持ち方にはポートレートとランドスケープという2つの方法があります。確かに持ち方によっては、2つのカメラではカメラが持ち手に隠されてしまう可能性があるので、四隅全てにカメラを設置することはとても理にかなっています。またカメラの画角も120°と、広角なレンズを使うことで、カメラの認識できる視界をさらに稼いでいます。

 さらには、四隅全てのカメラに赤外線センサーを装備することで、室内や夜など、明かりが少ない場所でも動作できます。ベゾス氏いわく、「僕がベッドの中でも使いたかったんだよ」と言っていました。

 カメラを増やすだけで問題が解決できるなら、あとはコストの問題だけのように思えます。しかし実際には、カメラを常時動作させると、バッテリー駆動時間に大きなインパクトを与えかねません。

 僕も、最初この話を聞いたとき「こんなことやってバッテリーは持つの?」と思っていたのですが、この点に関してもベゾス氏はちゃんと回答を用意していました。プレゼンでは技術的詳細までは把握できなかったのですが、何でも、通常のカメラ撮影の10分の1位のコストで撮影できるセンサーを使っているとのことでした。

 エンジニア視点では、今回のベゾス氏のプレゼンで最も心に残ったエピソードが「このダイナミックパースペクティブのプロトタイプは一週間でできたけれど、最終的に完成させるために、その後4年間研究を続けた」という話でした。

 前回のAppleのWWDCの話でも触れましたが、AppleにしてもAmazonにしても、一見派手に矢継ぎ早に新しいモノを発表しているように見えて、その裏では非常に地道な努力を続けている点に、とても感心させられます。

 この動きの速い現代、業界で、半年ごとに新製品が求められる中で、このようにしっかり技術を育てるというスタイルこそ大企業の強みだと思うのです。ここら辺をしっかり分かっているトップがいる企業はやっぱりすごいなと、あらためて感心してしまいました。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。