Google I/Oの会場であるモスコーニ・センターでは開催期間中は至るところにArduinoが設置されていた。このArduinoは光や温度、湿度、騒音、空気の汚れ、電波など各種センサを取り付けられ、ノード間のワイヤレス通信によって会場全域のデータを取得していた。
取得したデータはGoogle Cloud Platformに集められ、分析された。大量のデータを収集するため、センサから送信されたデータの受付は必要に応じてスケールアウトするGoogle App Engineを利用し、タスクキューで非同期にGoogle Cloud Datastoreにデータを蓄えた。
溜め込んだデータを、そのまま分析するのは負荷が高く、またデータの冗長性がないのでGoogle Cloud Storageに定期的に移動し、移動したデータをGoogle Compute EngineとBigQueryでデータ集約を行っている。
データ分析に非常に便利な「R」「Scipy」などはGoogle App Engineでは利用できないため、Google Compute Engineで実行する必要がある。このセッションでは、近隣のセンサ同士の相関を見るために集めたデータを部分的にCSV形式で取り出してRで相関係数を求めた。
ATRASは素粒子物理学の研究のために設置されたCERN(欧州原子核研究機構)の加速器である。素粒子の検出器には150万個ものセンサが設置されて、2013年現在、140Pbytesもの巨大データを管理している。
このデータはATLASの計算機でモンテカルロシミュレーションによって分析されるが大きな発表直後や会議前など時期によってATRASの計算機の能力を超えてしまうことがある。その際には、Google Compute Engineを利用した。
スケールアップ時に問題が発生することもあったが、主にATRAS側の問題が原因で、Google Compute Engineは安定していたとのこと。
核物理学のコミュニティによって開発された分散コンピューティングフレームワーク「PROOF」とクラスタストレージエンジン「Xroot」が紹介された。またATRASとGoogle Compute Engineとのデータ転送にはBitTorrentと同様な技術が用いられて、マルチストリームで通信することで平均57Mbytes/sもの速度に達したという。
Google Cloud Platformは後発のサービスであるため、ロードバランサがないなど機能的にはまだ足りない部分がある。しかしながら、AndroidやChromeとの連携は他社にはない大きな優位点である。さらに、データ分析基盤であるBigQueryを利用できることも非常に利用価値が高い。
現在は米国と欧州のみにリージョンが存在するが、アジア地域へのリージョン開設もあり得るため、今後の動向に注目したい。
Copyright © ITmedia, Inc. All Rights Reserved.