データ分析とは何であり、具体的に何をすることか? なぜ行うのか? どんな人が行っているのか? どこで行われているか? に加えて4つのポイントを紹介する。
このたび、@ITで連載させていただくことになりました、リクルートテクノロジーズの青柳と申します。ビジネスのデータ分析業務に、12年ほど関わっています。この連載では、読者の皆さんに、ビジネスにおけるデータ分析の具体的なイメージをつかんでいただきたいと思います。
第1回目の今回は、「データ分析とは、そもそも何なのか」「何のためにやるのか」など、ビジネスにおけるデータ分析の4W1Hについて、筆者の今までの経験や知識に基づいてお話しします。
データ分析とは、何をやることなのでしょうか?
ここでは、データ分析の概要についてお話ししながら、データ分析の定義を考えたいと思います。
まず、データ分析について考えたときに、その操作が必要かつ簡単な順に並べると、以下のようになります。
まず1.ですが、これはただデータを集めてためているだけですので、これだけで活用とはいきません。これに対して、2.や3.になると、活用できる可能性があります。
2.と3.は、広い意味ではどちらも「分析」ですが、2.は広義の、3.は狭義の分析といえます。これらの違いを、【1】分析手法の複雑さ、【2】仮説の有無、の2つの視点から考察します。
まず【1】の「分析手法の複雑さ」という点について考えてみます。まず2.の「データ集計」では、基本的にクロス集計が行われます。これは、「支店別に売上金額の合計をとる」「商品別の売上シェアを計算する」「日別に営業成績を計算する」などの簡易な集計です。一方、3.では、それよりも複雑な手法が使われます。例えば、重回帰分析や因子分析のようないわゆる統計解析手法がこれに当たります。
続いて、【2】「仮説の有無」について考えてみましょう。まず「仮説」とは何か、ということですが、例えば「商品Aと商品Bは売上に差があるのではないか」「広告投資は、売上の増加に効果があるのではないか」などのような、分析を行う人が分析対象について主張したい「法則」のようなものを仮説と言います。
3.は、この「仮説」が明確に存在していて「仮説が正しそうかを検討したい」という意図がある場合に行います。これを行うために、【1】で話したような複雑な手法が必要になります。一方、2で使われるようなクロス集計は、見たい軸で集計してみて、傾向をつかみ、何らか検証すべき仮説を発見するために行う手法です。クロス集計の結果から傾向が読み取れるので、それを使って仮説の妥当性を検証できてしまうのですが、このような方法は、本来は(統計学的には)誤っています。
具体的な例を挙げます。ある分析者が、店舗ごとに商品Aと商品Bの売上を計算してみたところ、Aが売れている店舗の方が多く存在しました(集計)。そのため、この人は、「商品Aが商品Bよりよく売れている」という主張を立て(仮説導出)、これに対して統計的仮説検定を行いました。その結果、「商品Aが売れている」という仮説が支持される結果が得られました(分析)。そこで、この人は、商品Aの方が、商品Bよりも売れていると結論付けました。
以上をまとめると、データ分析とは「何らかの仮説を立て、その妥当性を統計的手法により検討すること」と定義できそうです。ここからは、この定義に基づいて話を進めていきます。なお、この定義は必ずしも一般的なものではないことをご承知おきください。
ビジネスにおいて、データ分析はなぜ行われるのでしょうか?
そもそもビジネスとは、ヒト・モノ・カネにまつわる意思決定の連続です。もう少し言うと、各企業内の各部署で毎日、大なり小なり、数多くの意思決定が行われており、その積み重ねでビジネス活動が進捗(しんちょく)し、その成果が決まっていきます。データ分析は、その意思決定をより「適正なもの」にするために活用されます。それでは、ここでの「適正に」とは具体的にどういうことでしょうか。
まず最も重要な点として、その意思決定により成果が上がらなければいけません。意思決定者の目の前にある選択肢をそれぞれ選んだときに、どのような利益がどの程度得られるのか、あらかじめ精度高く予見できていると、より効果的な意思決定につながります。これに対して、データ分析は「予測」でサポートします。ちなみに「予測」とは、支持された仮説は将来にも当てはまるという前提をもって、その仮説を将来に向かって適用することです。
もう一つ重要な点として、意思決定者は「なぜ、その選択をしたか」を会社に説明する義務(アカウンタビリティ)を負いますが、データ分析により、その選択が客観的に最適であることを説明できます。これを筆者は「可視化」と呼んでいます。上記の通り、予測自体が仮説なので、仮説検証のプロセスそのものが、可視化になります。
以上の通り、データ分析は「予測」と「可視化」を通じて、ビジネスにおける意思決定を適正化します。
実際にデータ分析を行っているのは、どんな人なのでしょうか?
上述した通り、データ分析では数学的、統計的に複雑な手法を用いることが多いことから、これらのバックグラウンドを持った人が分析を行うことが一般的です。これはデータ分析における「サイエンス」の素養であるといえます。
ただし、実務においては、これらの素養だけでは十分ではありません。データ分析には、計算機工学のスキルが不可欠です。例えば、分析プログラムを書く必要がありますし、データベースからデータを取得するために、データベースを操作できることが必要になることもあります。さらに、演算回数が多い手法を用いる場合は、計算インフラの整備や分散処理も必要になることがあります。これらは「エンジニア」的な素養といえます。
さらに、分析結果を活用する側から課題を聞き出し、それを分析課題に落とし込み、それを実施するためにプロジェクトを立ち上げ、運営する素養も必要です。 納得感のある統計モデルを作るためには、事業側から仮説を引き出したり、自身の感覚で、新たな仮説を付け加えたりすることも求められます。分析結果を実務で活用する際には、事業側と協力して人を動かす「仕組み」を作ることもあります。これらについては、「コミュニケーション」「アート」の素養といえます。
最近の時流、上記に挙げた素養のうち「サイエンス」に焦点が当たりがちですが、データ分析を行うためには、これら3つの要素を適切に組み合わせる必要があります。
ただ、これらの素養を全て備えている人は普通はいませんので、それぞれの領域が得意なメンバーを集め分析部門としての組織を構成します。この際、各メンバーは得意領域以外のことも、多少は素養があった方がよいと思います。例えば、「コミュニケーション」の人が分析手法の知識や経験を持っていると、「事業課題を分析課題に落としやすくなる」「分析者に指示を出しやすくなる」などのメリットがあります。
ここでは、企業組織という点でWhereを考えてみます。どんな会社のどんな部署で、データ分析は行われているのでしょうか? 筆者が把握している範囲で、主要なものについてまとめてみます。
まず一つ目として、事業会社(消費者にサービスを提供している会社)に分析部門があり、そこで分析を行うケースです。分析者と分析結果を使う人が会社に存在しているため、物理的にも心理的にも距離が近いことが特徴的です。それにより、分析結果を実際の施策に活用することが進めやすい傾向があります。ただ、一方で「組織の理論」に巻き込まれて、客観的な分析が難しくなることもあるようです。
二つ目として、事業会社にサービスを提供するBtoB企業の一部門としてデータ分析部門が存在していることがあります。これは、自社の商品・システムを販売する際に、付加価値を付けるといった意図があると思われますが、純粋に、データ分析のみで生計を立てている部門がある場合もあります。その他にも、広告代理店の一部として存在し、広告・メディアプランニングに関する分析を行うケースや、コンサル企業の中にデータ分析専門の部署が存在することもあります。
三つ目に、ビジネス実務を行っている部署で分析を行うことがあります。これは、「実務に即つなぐことができる」という点で非常に強いのですが、本業が忙しく、なかなかそこまで手が回らないことが多いようです。また、現在の状況では、実務を行っている人には、サイエンス・理論・エンジニアリングの素養が十分でない傾向もあり、このケースはあまり多くはないようです。
データ分析における「How」にはいろいろありますので、ここまででお話しなかった、データ分析に関わるポイントをいくつか列挙し、それぞれの内容を簡単に説明したいと思います。
どのような手法を用いればよいかは、分析課題、使えるデータ、工数などで決まります。Whyのところで話したように、実務使用者の意思決定に活用する場合は、「なぜ、そのような分析結果になったか」が明確になる必要があるため、統計的な手法が用いられることが一般的です。一方で、レコメンド機能を自社のサービスサイト上に展開するなど自動化の側面が強い分析では、予測のメカニズムを明確にする必要がないので、機械学習系の手法が用いられる傾向にあります。
なお、分析手法を選ぶ際の原則として、できるだけ簡易なものを使う、というものがあります。この理由ですが、難易度が高い手法は、簡易な手法に比べて、開発や実装により工数(=コスト)が掛かります。一方で、得られる知見はそこまで増えず、結果として費用対効果が低くなる傾向があるためです。
データ分析も、ビジネスにおける一般的なプロジェクトと同じものです。この点で、プロジェクトを適切に運営することが必要になります。解決できそうな実務上の課題を見つけ、それを解決するためにメンバーを集め、企画書を書き、予算を確保し、プロジェクトを立ち上げ運営し、ビジネス実務に活用していかなければなりません。
データ分析は、ビジネス実務に活用してこそ、その存在意義があります。うまく活用するためには、「プロジェクトの立ち上げのときから、分析担当者と実務担当者とが連携をとることが重要だ」と筆者は考えています。分析結果を活用するためのアウトプットとして、分析結果を組み込んだツールを開発することもあります。
データ分析も、会社から見れば投資です。そのため、会社に対してどんな貢献をしたか、明確にする必要があります。そこで、分析プロジェクトを立ち上げる際には、このプロジェクトで何をゴールとするか、明確にしておくことが重要です。ここでは、「分析上の目的と、実務上の目的をきちんと分けて考えおく」ことが一つのポイントといえます。また、事業担当者が過剰な期待を持ってしまわないように、期待値調整を行うことも重要です。
今回は、データ分析の4W1Hについてお話をしましたが、何となくイメージをつかめたでしょうか。次回以降は、今回お話した中からいくつか取り上げて、詳しく解説したいと考えています。
青柳憲治
リクルートテクノロジーズ ITソリューション統括部 ビッグデータ部 ビッグデータ1G
筑波大学大学院ビジネス科学研究科企業科学専攻(博士後期課程)
大学卒業後、マーケティング・コンサルティング企業に入社。約8年間、広告効果分析を中心としたマーケティング関連データの分析業務に携わる。
2012年1月よりリクルート入社。リクルートグループ全体のマーケティングの高度化を目指してデータ解析チームを立ち上げ、現在に至る。
また業務の傍ら、筑波大学大学院ビジネス科学研究科(博士前期課程)・同大学院企業科学専攻(博士後期課程)に所属し、先端的な統計解析手法を用いた計量マーケティングをテーマとして研究に取り組む。
Copyright © ITmedia, Inc. All Rights Reserved.