データサイエンティストが提供する「データ分析ツール」の意図をあらためて考えるDatabase Watch(2016年11月版)(1/2 ページ)

今後のビジネスに直結するとされる「データ分析」の重要性が叫ばれ、技術も手法も急速に進化してきています。今回は、あらためてデータ分析とデータベースの関連性を整理し、データサイエンティストと呼ばれるスペシャリストがデータ分析で何を重視してるのか、実際の製品を通じて考えます。

» 2016年11月09日 05時00分 公開
[加山恵美@IT]

連載バックナンバー

 「ビッグデータ」という言葉が、もうバズワードではなくなり、世の中でも普通に聞かれるようになってきました。ビッグデータ分析を大まかに捉えると、これまで分析しきれなかった膨大なデータを詳細に分析し、関連性がないと思われていた、あるいは保存していたとしても使う機会のなかったデータとデータを合わせて分析することで、そこから何か新しい気付き/知見を得て、会社や組織全体のビジネスに役立てるものです。

 実際にビッグデータから新しい知見を得て、それをビジネスに変えた事例は既にたくさん生まれています。その一方で、先日、知人がふとつぶやきました。「砂金探しになっていないだろうか」と。「とにかくデータをたくさん集めれば何か出てくる」と期待すると、データ収集に躍起になってしまいがちです。データがなければ砂金=知見は見つかりません。しかし、データが多ければ砂金が必ず出るわけでもありません。

 つまり、データ分析で成功するかどうかは、データの多寡では決まらないということを言いたかったのでしょう。そんな迷走を避けるには、少なくともデータ分析の目的である、ビジネス課題の解決や改善から目をそらさないことが大事です。

 そこで今回は、それに気付かせてくれたデータ分析製品を2つ取り上げます。いずれもデータサイエンティストの研ぎ澄まされた視点やスキルを基に機能が実装されています。

ビジネス課題を解析目的として設定する、データビークルの「Data Diver」

photo データビークルの西内啓氏

 あらためてデータサイエンティストとは、「高度な統計解析ツールを使いこなす」「データから新たなビジネスの知見を発見する」といったスキルを持つスペシャリストです。例えば、日本を代表するデータサイエンティストとして、『統計学は最強の学問である』(ダイヤモンド社)の著者である西内啓氏がよく知られています。

 その西内氏が取締役として加わり、2014年に設立された会社がデータサイエンス専門企業となるデータビークルです。同社は、西内氏のデータサイエンティストとしてのノウハウを生かし、「データサイエンスをみんなの手に」というコンセプトを掲げてデータの価値を最大化するための事業を行っています。実際の製品として、データ分析ツール「Data Diver」、データサイエンス専用変換ツール「Data Ferry」があり、さらに、どんな製品かはまだ不明ですが、“データ分析のための秘密基地”とうたう「Moon Base」という製品も2016年秋に発表予定としています。

 Data Diverは、一般的なBI(Business Intelligence)/BA(Business Analytics)ツールとは違い、「データサイエンティストがやること」をツール化した製品とうたっています。「Python」や「R」といった言語をマスターしていなくても、GUI(Graphical User Interface)画面から条件を選択する作業だけで高度な分析を進めていけます。

 Data Diverでは、まず「解析の目的を明確に指定する」ところが特徴的です。例えば、「顧客の購買単価が少ない」が課題ならば、Data Diverの画面で「(顧客ID)ごとに見た(価格)の(合計)が(少ないことが課題)」といった変数や条件をプルダウンメニューより指定して、明確な解析の目的を設定します。ここでは、「顧客の購買単価を高めたい」となるでしょう。このように、「何のために、データを解析するのか」「ビジネスでは、どんな課題を抱えているのか」のビジネスの課題を直接意識しながら分析することで、分析スピードのロスとなる思考の迷走を極力避けられるとしています。

photo Data Diverでは、まず「解析の目的」を指定してから分析を始める

 解析目的を設定すると、目的となる項目へ影響を及ぼすであろう項目がリストアップされます。例えば、「(ダイレクトメール)の件数が1増えるごとに(価格)の合計が(金額)(高い/低い)傾向にあります」など、ユーザーが目的とする項目と関連性がありそうな項目が表示されます。その項目と組み合わせて、データをさらに深く探っていくという流れです。そして、分析された結果も、自然な日本語の文章で分かりやすく示されます。ユーザーは、自然な文章で示された分析結果のリストから、有効と判断できる結果を選ぶだけでよいのです。

photo 解析後の説明変数も、自然な日本語の文章で分かりやすく表示される

 この他、このData Diverは「グラフ表示の“手触り感”をかなり工夫した」と同社は述べています。手触り感とは、グラフ上でマウスを動かすと、マウスオーバーしている部分のデータ詳細が浮き上がってくるエフェクトなどのこと。「直感的な解析アイデア=予測モデルの思い付き」は、こういったインタフェースの工夫もかなり寄与するのだそうです。

 何よりも大事なのは、やはり「最初からビジネス課題にフォーカスしている」ことでしょう。西内氏は製品発表時に「月を見ながら林を歩くこと」と、データ分析では目的を見失わないことの大切さを強調していました。

 ※初出時、データビークルの設立年に誤記がありました。正しくは上記の通りです。お詫びして訂正いたします。
       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

スポンサーからのお知らせPR

注目のテーマ

AI for エンジニアリング
「サプライチェーン攻撃」対策
1P情シスのための脆弱性管理/対策の現実解
OSSのサプライチェーン管理、取るべきアクションとは
Microsoft & Windows最前線2024
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。