|
中堅スーパーのデータ活用物語
〜はじまりはExcelのデータだった〜
「BIなんて人ごと」と思っていたシステム管理者の挑戦
第2回 Excelでお手軽データマイニングに挑戦! |
県内で全10店舗を運営する地方の中堅スーパー「フクフクドー」。ここでは、さらなる事業成長のための次の一手をどう創り出していくかが目下の課題。営業企画部からの救援要請があり、BI(Business Intelligence)の活用というアイデアの実現に向け一歩を踏み出した。とはいえ、従来型のBIはシステム規模も大がかりで、導入に多大な投資を要するうえ、使いこなすのも困難だと考えているIT部門のシステム管理担当者「番次郎」は慎重な態度を崩さない。最新のBI環境は、こうした慎重論を打破できるだろうか。若い現場担当者の熱意に押される形で、フクフクドーでBI活用の実地検証が始まった。奮闘が始まった。
* この物語はフィクションです。登場人物や団体、文中で使用するデータなどは、すべて架空のものです。 |
登場人物 |
|
番次郎(ばんじろう)。31才。「フクフクドー」情報システムの実質的な管理責任者 |
|
いぶき。25才。修行中ではあるものの、チャレンジ精神旺盛な新米システム管理者 |
|
椎来 太郎(しいくる・たろう)。31才。番次郎と同期入社の営業企画部課長 |
<登場人物紹介と前回までのあらすじ>
■Data Mining Add-insを使ってみる
フクフクドー営業企画課長の椎来は、IT部門の新人管理者であるいぶきにアンケート・データの解析について相談し、SQL ServerのData Mining Add-ins(データマイニング・アドインズ)を試してみてはと勧められた。手元のExcel 2007に無償提供されるData Mining Add-ins for Office Systemを追加インストールし、バックエンドにあるSQL Server 2005のデータマイニング・エンジンを利用してデータ解析を行なうものだ。ただし、本当に役立つかどうかも分からないのに、SQL Serverを購入するわけにもいかないので、まずはマイクロソフトが提供している無償試用版の分析エンジンで試してみることにした。椎来のところにいぶきがやってきて、準備が始まった。
マイクロソフトが提供している無償試用版の分析エンジンを利用するには、以下のURLのWebページで[BI体験はこちらから]ボタンをクリックし、Windows
Live IDでサインインを行う。「Business Connection」で「より高度なデータ分析を Excel で手軽に実現!『簡単データ分析キャンペーン』実施中!」のリンクをクリックすれば、SQL
Server 2005のData Mining Engineをサービスとして利用できる体験サイトへアクセスできる。
・Business Intelligence(マイクロソフト)
http://www.microsoft.com/japan/solutions/bi/default.mspx |
|
試用版分析エンジンへの接続画面
Excel 2007にData Mining Add-ins for Office Systemをインストールした後、マイクロソフトがインターネットで提供している試用版の分析エンジンへ接続する。マイクロソフトのWebページで登録すると、分析エンジンに接続するためのアカウントが発行されるので、それに従って、サーバ名などを入力すればよい。 |
|
|
これでExcel 2007でData Mining Add-insが使えるようになりました。特に難しい部分はないから、一般のユーザーでも問題なく使えそうですね。 |
|
|
|
|
|
あぁ、なるほど。リボンのところに「データマイニング」って項目が増えているね。でも、ここからどうすればいいのか、よく分からないな。 |
|
|
|
|
|
まずは、分析のためのデータを用意します。アンケートの結果は、Excelで集計してあるんですよね。ファイルはどれですか? |
|
|
|
|
|
そのデスクトップにあるExcelシートがそうだよ。それはコピーで、オリジナルは別に保存してあるから、内容を変更しても問題ないよ。 |
|
|
|
|
|
それは助かります。実は分析のためには、まず分析対象のデータ範囲を「データ・テーブル」に変換する必要があるんです。でも、準備はそれだけで、あとは範囲を指定しさえすれば……。 |
|
|
|
|
|
おっ、新しく「分析」という項目が出てきたね。なるほど。まずは6種類の分析が実行できるようだね。 |
|
Excel 2007+Data Mining Add-ins for Office Systemの画面
Excel 2007にData Mining Add-ins for Office Systemをインストールし、Excelシート上にデータ・テーブルを作成すると、初めて[分析]メニューが使えるようになる。
|
「分析」メニューには「主要な影響元の分析」「カテゴリの検出」「例の全体適用」「予測」「例外の強調表示」「シナリオ分析」の6項目が用意されており、ここから簡単にデーマイニングが実行できる。 |
|
Data Mining Add-ins for Office SystemをインストールしたExcel 2007でファイルを開いただけでは、[データマイニング]というメニューが表示されるだけである。Excelシート上にデータ・テーブルを作成すると、初めて[分析]メニューが使えるようになる。Data Mining Add-ins for Office Systemをインストールするだけで表示される[データマイニング]メニュー(トップレベル・メニュー)に用意されているのは、従来のデータマイニングの手法に詳しいユーザーがSQL ServerのData Mining Engine(データマイニング・エンジン)の機能を使いこなすためのものなので、初心者には少々荷が重そうだ。まずはこの「分析」メニューに用意された、「主要な影響元の分析」「カテゴリの検出」「例の全体適用」「予測」「例外の強調表示」「シナリオ分析」の6項目から試してみることにした。各分析機能の働きは次のとおりだ。
分析機能 |
内容 |
主要な影響元の分析 |
結果について何が影響を与えているのかが分かる
【例】商品の購入パターンを分析する |
カテゴリの検出 |
データを複数の傾向から分析する
【例】売れ筋商品と損切り商品を明確に分離する |
例の全体適用 |
不足するデータを補い、全体の分析を可能にする
【例】欠損した収集データでも対象顧客を絞り込みたい |
予測 |
過去のデータから将来のデータを予測する
【例】過去の売上データから、今後の販売予測をたてる |
例外の強調表示 |
特異なデータだけを抽出できる
【例】アンケートから特異な例外データを排除する |
シナリオ分析 |
想定した複数の結果に対する必要なデータを明かにする
【例】必要生産量と在庫の関係を複数分析し、最適化する |
Data Mining Add-ins for Office Systemに用意されている分析項目
|
-
まずは、「例外の強調表示」を試してみましょうか。データの中から、ほかのデータからかけ離れた傾向を持った例外的なデータを抽出してくれる機能らしいですよ。
-
ええと。対象となるデータ項目を指定して、実行するだけか。操作も簡単だね。これならあらかじめマニュアルを見る必要もないな。
-
実行すると……。あっ、出ましたね。どれどれ、何が例外なんだろう。って、この人、ほぼ毎日1万円分お弁当を買うって、ちょっと変ですよね。
-
本当だ。間違って回答したのか、集計の時に入力ミスしたのか分からないけど、これはちょっと信じられないね。
-
では、無効データということにして、この行は削除しておきましょう。このデータがあることで、これ以降の分析結果が不正確になっても困りますしね。
|
■さらに分析を進める
|
|
無効データが排除できたところで、いよいよ本番ですね。 |
|
|
|
|
|
そうだね。でも、どの分析を実行したら売り上げ拡大策が見えてくるのか……。 |
|
|
|
|
|
よく分からないけど、まずは「カテゴリの検出」をやってみませんか? お客様にどのようなグループがあるか、傾向が分かれば、何か見えてくるかもしれませんよ。 |
|
|
|
|
|
う〜ん。当然ながら主婦が多いのは分かっているけど、ほかに何か分かるんだろうか? |
|
|
|
|
|
まあまあ。では、今度は「カテゴリの検出」を選んで、実行すると……。 |
|
|
|
|
|
うわっ。結構細かく分類できるんだね……。カテゴリ数が10種類もあるぞ。 |
|
[カテゴリの検出]の設定画面
[分析]−[カテゴリの検出]を選択し、[カテゴリの検出]ダイアログ・ボックスでカテゴリの検出に使用する列を選択する。
|
カテゴリの検出に使用する列をチェックする。ここでは年齢から購入金額までの列を対象としてカテゴリの検出を実行した。→ |
|
|
[カテゴリの検出]の分析結果画面
分析の結果、10種類のカテゴリが検出できた。それぞれのカテゴリの特性は、項目ごとに相対的な重要性がグラフで示される。例えばカテゴリ1は、主婦で、1回当たりの購入金額は1495円〜3076円、徒歩で来店といった具合だ。 |
|
|
自動検出にしてみましたが……。分類の基準もいろいろですね。一番多いのは徒歩で来店する主婦か。これは分かっていたとおりですね。 |
|
|
|
|
|
どうもこれは、あまり役に立たなかったかな? |
|
|
|
|
|
どう? 何か売り上げ拡大策につながるような分析はできた? |
|
|
|
|
|
まだ、これからいろいろと試してみないと。そんなすぐには……。 |
心配になったのか、番次郎が様子を見に来たようだ。いぶきはちょっと困ったような表情を浮かべたが、何かに気がついたように、目を輝かせた。
|
|
さっきはカテゴリ数を自動検出のままにしておいたので、分類が細かくなりすぎたようです。今度はカテゴリ数を限定してやり直してみましょうか。例えば「カテゴリの最大数」を4にしてみると……。 |
|
|
|
|
|
おっ。今度はちょっと見通しがよくなったね。来店の手段が高い重要度でカテゴリ分類されているね。徒歩と自転車で来店する人は、ほぼ毎日来店というから、きっと毎日の食事の材料を買いに来るということだね。 |
|
[カテゴリの検出]でカテゴリの最大数を設定した場合の分析結果画面
カテゴリの最大数を4に絞ることで、見通しのよい分析結果が得られた。このように条件をいろいろと変更して分析を試すことで、新しい発見が得られることがある。 |
|
|
自転車で来店する主婦は、来店頻度はほぼ毎日だけど、特売情報をよくチェックしているわけか。この人たちは、特売品が目当てということになりそうだな。 |
|
|
|
|
|
なるほど。3位のグループは自動車で週に1〜2回来店する人たちだね。これは週末のまとめ買いかな。1回の購入金額はこのグループが一番高いけど、これは当たり前のことか……。 |
どうやら、カテゴリの最大数を制限したことで大まかな特徴をつかむことができたようだ。いぶきはちょっとコツがつかめたような気がした。
|
|
なるほど。1回分析して終わりじゃなくて、結果を見てから条件を変更して、繰り返し実行してみるといいみたいですね。 |
一方椎来は、カテゴリの分類にすっかり感心しているようだ。番次郎も、手軽に分析できることに少々驚いた。
|
|
面白いな、これ。Excelだけで集計しても、なかなかここまで踏み込んだグループ分けはできなかったし、改めて気付かされることもある。これだけでも使う価値があるね。 |
|
|
|
|
|
でも、まだ肝心の売り上げ拡大につながる傾向は見つかってないんだろう? |
|
|
|
|
|
まだ先がありますよ。今度は、「主要な影響元の分析」をやってみましょう。私の予想では、これが一番役に立つ結果を出してくれるはずなんです。 |
■鉱脈は掘り当てられるか?
「主要な影響元の分析」は、あるデータに対して、ほかのどの項目が相関を持つかを見つけ出す分析だ。営業企画の椎来としては、やはり「購入金額」の多寡を決めている要因が何なのかを知りたいところである。
|
|
では、「主要因を分析する列の選択」では「購入金額」を指定しましょう。 |
|
|
|
|
|
アンケートでは、1回のお買い物の金額はどのくらいですか、という質問になっていたんだ。よく来店する人は、平均的な買い物の額を答えてくれたと思うんだけど、来店頻度が低い人は、アンケートに答えた日の買い物の額を書いているかもしれないなぁ。 |
|
|
|
|
|
指定するデータはそれだけですね。後は「実行」するだけで、結果が出ますね。 |
|
|
|
|
|
どうなった? 何か具体的な要因があるのかな? 特に規則性はないのかな? |
|
|
|
|
|
あっ、出ました。最初に出ているのは、未成年ですね。子供がお小遣いでお菓子を買いに来るのか、近所の高校生が帰りがけに軽食でも買うのかな。購入金額が1000円以下になる場合、年齢が主たる影響要因みたいです。 |
|
[主要な影響元の分析]の分析結果画面
「購入金額」の列を主要因として分析した結果、何が購入金額に影響を与えているのかが見えてくる。例えば、1000円以下の場合は年齢(未成年)、1000円〜1600円の場合は有用情報(特売日)が、主要因となっていることが分かる。 |
|
|
ははは、なるほど。でも、「おむつとビール」みたいなうまい話じゃないね。 |
|
|
|
|
|
ちょっと待ってください。次の層はちょっと面白いですよ。購入金額を基準にすると、主婦層が2グループに分かれているみたいです。 |
|
|
|
|
|
本当だ。1600円を境に分かれるみたいだね。 |
|
|
|
|
|
では、追加のレポートを作ってみましょう。未成年は除外して、購入金額が1000〜1600円のグループと、1600〜2000円のグループの比較をしてみるとどうなるか……。 |
|
[主要な影響元の分析]の分析結果を比較分析した画面
購入金額が1000〜1600円のグループと、1600〜2000円のグループの比較を行うと、両グループの傾向の違いがはっきりと見えてくる。特徴がはっきりと分かるため、そのグループへの対策が立てやすくなる。 |
|
|
うーん、これは凄いよ。傾向がくっきり分かれている。 |
|
|
|
|
|
ホントですね。グラフがきれいに交互になっていますね。 |
|
|
|
|
|
これを見ると、何を買うかを店頭で決めて、かつ店内に掲示された情報から、お勧めの献立や調理法の情報に注目している人の購入金額は高めだ。一方、来店前に何を買うかをあらかじめ決めていて、特売情報に注目している人は安めなんだね。 |
|
|
|
|
|
私も店頭で特売品を見てから献立を決めて、節約しようと思ったりするんですが、それは難しいってことでしょうか。 |
|
|
|
|
|
どうだろうね。でも、われわれが考えるべきポイントはそこじゃないよ。来店してから何を買うかを決めている人は、店頭の献立情報やお勧めの調理法をよくチェックしてくれているということだよね。それなら、店内の掲示を充実させて、情報をもっと増やしたら喜んで貰えそうだ。 |
|
|
|
|
|
意外と店内の情報も活用されているんだなぁ。 |
|
|
|
|
|
そうですね。その場で何を買うか決める人の立場になって考えてみると……。きっと、売り場に並んでいる素材を見ながら、「これを買うと何が作れるかな」って考えているでしょうね。だから献立情報や調理法をよくチェックするんだわ。とすれば、食材のすぐそばにお勧めの調理法を掲示したら喜ばれそう。 |
|
|
|
|
|
なるほど。それならあまりコストも掛からないし、すぐにでも始められそうだよ。 |
|
|
|
|
|
で、メインの食材を選んで、何を作るかを決めたら……、組み合わせて使うほかの食材を一緒に買っていきますよね。では、いっそのこと、お勧めの献立を表示して、合わせてその料理に使う食材をひとまとめにしておくっていうのはどうですか? それなら、一カ所でまとめて必要なものが揃って便利かも。 |
|
|
|
|
|
なるほど。「今日のオススメ献立」専用棚を作るわけか。確かに、仕事帰りに急いで立ち寄る共働き世帯などには喜ばれそうだ。いぶきくんみたいな横着者にも、歓迎されるかもしれないぞ。 |
|
|
|
|
|
横着とは失礼ですね。でも、正直店内をあちらこちら回って必要な食材を集めるのは結構面倒だし、いつも何か買い忘れるんですよね。 |
|
|
|
|
|
よし。今度の店長会議で提案してみよう。 |
■分析結果が成果に繋がる
椎来は、献立提案棚のアイデアを店長会議で提案し、テスト店舗で試してみる許可を得た。いてもたってもいられない気分のいぶきは、店舗に出かけていき、献立提案棚の準備まで手伝った。その結果……。
あれから、いろいろとほかのデータも試してみたけど、Data Mining Add-insはなかなかいいよ。アンケートの結果から、いままで気が付いていなかった傾向を読み取ることができたし。
で、献立提案棚の反応はどうだった?
肉やら野菜やら、別のカテゴリの食材を同じ棚に置くのは最初ちょっと抵抗があったけど、お客様の反応は上々だったよ。劇的とはいえないが、売上もアップしたしね。実際、同じ食材でも、いつもの売り場より提案棚から手に取るお客さんが多かったらしいよ。テストとしては上々の成果といえるね。
すごい成果ですよ。データを分析することで新しいアイデアに繋がったんだし、しかもほとんどコストが掛かっていないですから。
うれしさを隠しきれない様子で出て行った2人を見送ると、番次郎はサッとモニタに向かい、何やら調べ始めた。
|
|
驚いたな。BIをまともに導入したら相当高額に付くはずだし、安価で手軽なシステムとなると「安かろう悪かろう」で役に立たないだろうと予想していたけど、具体的な成果が上がったとなると、予算を申請しても通るかもしれないな。となると、現実的な予算の範囲内でどの程度のことが実現できそうか、ある程度目処を付けておかないと、いぶきに負けるわけにもいかないからな。 |
どうやら、BIに対する先入観で慎重になっていた番次郎も、具体的な成果を見て、重い腰を上げる気になったようだ。とはいえ、慎重にコストと効果を天秤にかける番次郎にも納得できるシステムになるのか。SQL Server+Data Mining Add-insの実力が、さらに試されることになる。
<第3回に続く>
提供:マイクロソフト株式会社
企画:アイティメディア 営業局
制作:デジタル・アドバンテージ
掲載内容有効期限:2008年1月31日 |