楽天グループは、全社的なデータ分析基盤として、Google Cloudのデータウェアハウスサービス、BigQueryを採用したことを明らかにした。2022年第4四半期には、全事業のデータ移行を完了するという。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
楽天グループは、全社的なデータ分析基盤でGoogle Cloudを採用した。2022年4月19日から21日にかけてGoogle Cloudが開催中のイベント、「Google Cloud Day: Digital ’22」で明らかにした。
楽天グループは自社データセンターで、同社が「SuperDB」と呼ぶデータウェアハウスを運用している。このデータウェアハウスが格納しているのと同じETL処理後のデータを、Google CloudのBigQueryに移行する作業を進めているという。
移行プロジェクトは2021年2月に開始。楽天グループの中核ビジネスであるコマース事業や金融事業のデータ移行が終わり、 2022年第4四半期中には同グループの全事業についてBigQueryを活用した分析ができるようになる。
楽天グループ 執行役員 Cloud Platform Supervisory Department ディレクターのロヒット・デワン氏によると、これまでのSuperDBでは、データ活用の進展に追いつけない状況になってきたという。
SuperDBは1000人以上のユーザーが活用しており、利用量は年率60〜70%で増大している。これに伴って、パフォーマンスについての不満が高まってきた。また、データサイエンティストからは、リソースを柔軟にスケールさせる形で、必要な時に必要なだけ使いたいというニーズが高まっている。 関連して、社内データセンターのリソース利用効率の問題もある。
そこで同社は、「SuperDB 2.0」と呼ぶ次の段階のデータウェアハウスを計画した。その構成要素として、大規模なPoC(概念検証)の後にBigQueryを選択したという。
BigQueryを選択した理由について、デワン氏はBigQueryのパフォーマンス/拡張性に加え、ドキュメントやトレーニングの充実を挙げている。Google Cloudのデータ関連サービスのロードマップにも満足しているという。
Google Cloudのサポートチームについても高く評価。「プロフェッショナルなサポートとデータ変換・移行ツールの活用で、移行作業をスケジュール通りに進められた」(デワン氏)。また、移行作業と同時にデータのクレンジング、検証を実施することで、データの品質を上げられたと話した。
社内ユーザーによる利用は既に始まっているという。
「特に、データサイエンティストの間で利用が広がっている。仕事上、こうした人たちは瞬間的に膨大なリソースを必要とする。だが、ハードウェアの管理はしたくない。サーバレスデータウェアハウスはとても魅力的だ。楽天の機械学習/AIを活用したイノベーションのカギにもなる」 (デワン氏)
ただしデワン氏は、「自社データセンターの運用は楽天の技術的なDNAの一部」だとし、自社データセンターとGoogle Cloudによるハイブリッドなデータウェアハウス構成を続けると話した。データサイエンティストをはじめとして、BigQueryや周辺ツールを活用したいユーザーはGoogle Cloud、一般的なBIをやりたいユーザーは社内データセンターのデータウェアハウスと、ユーザーのタイプによって利用する環境は分かれるだろうという。
ハイブリッド構成は、可用性の向上にも貢献する。複数の自社データセンターとGoogle Cloud、いずれかダウンした場合には他で補うことができる。
Copyright © ITmedia, Inc. All Rights Reserved.