トレジャーデータ、日本国内での事業展開を本格化:日本人が立ち上げたシリコンバレー発ベンチャー
クラウド型ビッグデータ処理基盤を提供する米国トレジャーデータが日本国内における事業展開を本格化させる。
米国トレジャーデータは2013年5月20日、クラウド型ビッグデータ処理基盤「Treasure Data Platform」の日本国内における事業展開の本格化と、国内外市場における事業戦略を発表した。米国トレジャーデータのCEOで、トレジャーデータ日本法人の代表取締役を兼務する芳川裕誠氏が会見を開いた。
同社は、2011年に米国カリフォルニア州において、CEOの芳川裕誠氏、CTOの太田一樹氏、ソフトウェア・アーキテクトの古橋貞之氏の3人が起業したベンチャー企業。日本人がシリコンバレーで立ち上げたベンチャーとして希有なだけでなく、米国ヤフーの共同創業者で元CEOのジェリー・ヤン氏や、プログラミング言語「Ruby」の開発者であるまつもとゆきひろ氏らから出資を受けており、同社に対する注目度・期待度の高さがうかがえる。
2012年11月には技術開発拠点として日本法人を設立し、2013年2月に事業開発拠点も設けた。「日本のソフトウェアエンジニアが世界で十分に通用することに強い確信」を得た芳川氏は、単なる事業拠点としてではなく、米国本社と連携してエンジニアがサービスを開発していくための開発拠点として、日本事業所の設立に踏み切った。
クラウドでビッグデータを処理するTreasure Data Platform
同社が提供するTreasure Data Platformは、自社開発技術とHadoop、クラウドサービス(AWS)を組み合わせたビッグデータ処理基盤。つまり、ビッグデータの処理基盤をクラウドで提供するサービスだ。大量のセンサデータや購買取引データ、Web閲覧・アプリケーションのログデータなどをクラウド上のデータベースにインポートし、そのデータに対してHadoopで並列分散処理を行い、大規模データの集計・解析を実現する。2012年9月に正式版のサービスを開始した。
データのインポート用のツールとして、「td-agent」を提供する。これは、オープンソースのログ収集基盤「fluentd」を企業システム環境向けに品質の安定化を行い、実行環境などとともにパッケージしたものだ。
データベースには、「Hadoop Distributerd File System(HDFS)」ではなく、自社開発の列指向型データベース「Plazma」を実装している。HDFSと比較して、データの保全性や処理速度、データの圧縮率に優れるという。
既存のBIツールやMicrosoft Excelなどとの連携は、HiveやJDBC経由で行うことができる。
Treasure Data Platformを導入するメリットとしては、例えば、「バッチ処理・データ集計の高速化により、1日1回のレポート更新を複数回に増やし、経営判断の高速化を図る」(トレジャーデータ日本法人 ジェネラルマネージャー 堀内健后氏)というものだ。
価格は、ストレージ容量2TB、クエリー無制限のBusienss版が月額3000ドル、ストレージ容量無制限、クエリー無制限のEnterprise版が個別見積もりとなっている。また、ストレージ容量150GB、60クエリー/月のStartup版も無償で提供されている。
国内ではクックパッドが導入
2013年5月現在、Treasure Data Platformの有料サービスは、Web/ゲーム業界や製造業界、小売・流通業界、通信業界、出版・広告業界など、米国をはじめ世界各国で約70社(そのうち日本国内は約30社)で導入されている。同社プラットフォーム上には、4000億件以上のデータが蓄積され、1日2万以上のバッチ処理が実行されているという。
国内の導入事例として、料理レシピサイトのクックパッドが紹介された。同社では、レシピのレコメンドを提供するために、年間を通して検索結果を蓄積して、旬の食材に合わせた集計を行っている。導入前のシステムでは、検索結果を蓄積するためのデータベースが肥大化し、日々のシステム運用や拡張をするための工数が増大していた。
この既存システムをTreasure Data Platformで置き換えることで、運用にかかっていたエンジニアの負担が軽減され、コスト削減に成功するとともに、エンジニアが本来のサービス開発に集中できるようになったという。また、従来システムではデータの更新に最大で24時間を要したものが、新システムでは5分ごとのデータ更新が可能になった。システムの構築は3週間で完了したとのことだ。
同社は、2013年中にグローバルで150社、日本国内では2013年中に合計50社の企業導入を目指している。
関連記事
- 今後も月次でリリース予定:Hadoopアプリ開発キット「Cloudera Development kit」を公開
Hadoop環境用のアプリケーション開発やデータ操作を容易にする開発キットをClouderaが公開。「いまどき」のアプリケーション開発者に扱いやすい環境を整備する。 - ビッグデータ活用に向け業務データを一元管理・利用:山崎製パン、基幹システムをSOA基盤上に刷新
山崎製パンは、同社基幹システム「ヤマザキ基幹システム」をSOA基盤上に刷新、稼働を開始した。生産や配送業務の効率化、現場の進捗状況など経営判断に必要な情報の見える化、商品管理などの運用負荷軽減やコスト削減を見込んでいる。 - ITエンジニアのためのデータサイエンティスト養成講座(1):ITエンジニアがデータサイエンティストを目指すには?
それぞれの専門分野を生かした「データサイエンスチーム」を結成すればデータ活用への道は短縮できる。そのとき、ITエンジニアはどんな知識があればいい? データサイエンティストとして活動する筆者が必須スキル「だけ」に絞って伝授します。 - SQL on Hadoopが実用段階に:Hadoop用クエリエンジン「Impala」がついに一般公開に
「Hiveの10倍速い」クエリエンジンが一般公開に。最新の列指向データフォーマットなどにも対応している。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.