なぜデータ基盤を作ったのか?「ゼクシィ縁結び・恋結び」で必要になった理由:開発現場に“データ文化”を浸透させる「データ基盤」大解剖(1)(1/2 ページ)
「ゼクシィ縁結び・恋結び」の開発現場において、筆者が実際に行ったことを題材として、「データ基盤」の構築事例を紹介する連載。初回は、サービスの概要とデータ基盤が必要になった理由について。
システム、プロセス、カルチャーをいかにエンジニアリングするか
本連載『開発現場に“データ文化”を浸透させる「データ基盤」大解剖』では「データ基盤」の構築事例を紹介します。具体的には、オンライン婚活サービス「ゼクシィ縁結び」ならびにその姉妹サービス「ゼクシィ恋結び」の開発現場において、筆者が実際に行ったことを題材としています。
データ基盤を実際に構築するのは容易ではありません。構築したデータ基盤を実際に利用し続けてもらうのはさらに難しいことです。
多くの関係者がデータを加工すると、似ている意味を持っていても微妙に異なるデータが生成されてしまい、どのデータが正しいのか誰も分からなくなってしまいます。きちんと全員に使われるためにはデータの持つ意味や加工ロジックを誰かが整理しなければいけません。
また、モダンなツールを使って派手なダッシュボードを構築しても、それだけでは1週間後には誰も見なくなってしまうでしょう。きちんと全員に使われるためにはデータの用途や運用面を考慮しなければいけません。
まさに筆者自身がそういった苦い失敗を乗り越えてきました。今ではソフトウェアエンジニアが担当案件の仮説検証に使うだけではなく、事務スタッフが分析SQLを実行することさえあります。そのくらい組織に普及できるようになりました。
本連載は、同じような悩みを抱えている方々に向けて情報を共有することで、少しでも多くの開発現場でデータを活用したプロダクト開発ができるように参考になればと思います。
主な想定読者は、「データ基盤の構築や運用を担当するマネジャー」「開発現場にデータ文化を浸透させたいソフトウェアエンジニア」です。
なお、技術要素としてはPythonやBigQueryを扱いますが、詳細解説ではなく技術選定の考え方に比重を置いて解説します。また「使われるデータ基盤」を構築するためには、システム面だけではなく開発プロセスや文化醸成も重要な観点です。担当する業務や組織において、システム、プロセス、カルチャーをいかにエンジニアリングするかについても触れます。
ゼクシィ縁結び、ゼクシィ恋結びにおけるデータ活用の概要
最初に「ゼクシィ縁結び」「ゼクシィ恋結び」というプロダクトの開発現場で、どのようにデータを活用しているのか、全体像を紹介します。
ビジネスのためのデータ活用
- 【1】KPI
登録ユーザー数、売上、お相手が見つかって退会した数といった指標をモニタリングしています。
経営企画部門であれば、過去のデータを基に予測モデルを作り、年間計画を立てます。マーケティング部門であれば、毎朝配信されるデーリーレポートを基に広告予算を調整します。
- 【2】ユーザー行動の可視化
行動ファンネルやジャーニーマップ、リテンションカーブを見ています。
ディレクターやデザイナーは、ユーザーの一連の流れを踏まえて「ユーザーの登録が何%増えると売上が何%上がる」といったロジックを組み立てます。その効果の見立てに基づいて、トップページのデザインを磨き込むといったアクションにつながります。
- 【3】施策の効果予測・計測
「新しいレコメンドロジックを入れた結果、対象ユーザーはマッチングしやすくなったのか」についてABテストの結果を分析するユースケースです。
また、「ロジックを変えたことで予期せぬ影響が出ていないか」も分析します。
他にも、「新機能を追加したときに、どのくらいのユーザーがその機能を使っているのか」を計測し、うまくいかない場合はその理由を分析して再挑戦するといったことをやっています。
ディレクターやマーケター、製品開発チームのソフトウェアエンジニアが自身の主導する案件について効果を分析しています。
プロダクト機能としてのデータ活用
- 【4】レコメンド
プロフィールやアンケートなどのデータを使ってユーザー同士の相性を予測し、合いそうな人をお勧めするレコメンドエンジンを開発しています。
機械学習エンジニアのチームが中心となって、高速に仮説検証を繰り返しながら日夜ロジックを改善しています。
- 【5】迷惑行為の自動検知
婚活サービスを安心して使っていただけるように、機械学習によって迷惑行為を自動検知しています。システム検知後はスタッフが内容を確認した上で、アカウントの利用停止やご案内を行います。
主にカスタマーサポート、セキュリティ、アプリケーション開発の担当者からなるCRE(Customer Reliability Engineering)チームが主管となって運用しています。
カスタマーチャネル
- 【6】問い合わせの傾向分析
ユーザーから日々寄せられるご意見や問い合わせの傾向を分析しています。そこが改善ポイントになり得るということです。
ディレクターやCRE、SRE(Site Reliability Engineering)の担当者が中心となって対処に当たっています。
- 【7】広告配信の自動最適化
サイトやアプリに表示されるバナー広告やディスプレイ広告の配信でもデータを活用しています。
マーケティングチームがデータを基に配信を最適化するための意思決定を行っており、その一部業務はシステムによって自動化しています。
システム
- 【8】システムモニタリング
クラッシュ率、レスポンスタイム、サーバログなどの各種指標を見ています。利用者が期待する水準のサービスを提供できているか、問題があるとしたらどこなのか、システム状況の計測と改善を繰り返しています。また、新機能や新ツールの導入時は、不具合の兆候がないかについてもモニタリングします。
SREチームが主導となって、カスタマーの期待に添うよう、サービスの信頼性を日々高めています。
- 【9】障害発生時の影響調査
ユーザーの皆さまには申し訳ないことではありますが、システムを扱っている以上は障害が起きることもあります。「どういったユーザーにどのようなご迷惑をおかけしているのか」を調査するために、行動データを分析します。その際に、必要に応じて可能な範囲で個別サポートを行っています。
チーム
- 【10】チームのキャパシティー
作業チケットの進捗(しんちょく)管理やベロシティーなどを計測しています。例えば、ある業務が特定の人に偏っていることは、チケットのデータから分かります。
開発マネジャーを中心として、チームの健康状況をデータ分析して、必要に応じて作業を分担するように工夫しています。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- ネット広告のデータ分析プロジェクトはどのように行われるのか
広告宣伝費を各宣伝媒体へのコスト配分を調整することで効率化したいという事業部の課題に対してデータ分析のプロジェクトはどう進められるものなのか。筆者の経験を基に紹介する。 - CVRをあと10%アップする、ビッグデータ分析とアダプティブUXの使い方
ABテストを利用したサイト改善の限界にぶつかっている人たちに向けて、リクルートグループ内で実践している改善ノウハウをお伝えする連載。今回は、中古車販売サイト「カーセンサー」を例に「検討フェーズ」を軸とした個別最適化やビッグデータ分析の有効な生かし方について解説する。 - Hadoop+Embulk+Kibanaのデータ集計基盤によるデータ可視化と集計データを活用したキーワードサジェストの仕組み
リクルートの事例を基に、大規模BtoCサービスに求められる検索基盤はどう構築されるものなのか、どんな技術が採用されているのか、運用はどうなっているのかなどについて解説する連載。今回は、ログデータの分析および可視化の基盤を構成する5つの主なOSSや集計データを活用したキーワードサジェストの事例を紹介します。