日本初のデータサイエンティスト養成講座の中味

「データサイエンティスト」って何だ

2012/06/04

 5月最終週に、おそらく日本で初めての「データサイエンティスト」トレーニングが開催された。このトレーニングコースが養成を目指す「データサイエンティスト」とは何なのだろうか。

 これはEMCジャパンが開催する「Data Science and Big Data Analytics」コースの第1弾。あくまでもベンダ中立のトレーニングで、ツールとして登場するのは統計処理言語の「R」やHadoopなど、オープンソースのもののみだ。EMCは今年第1四半期より、米国で同様のトレーニングと認定資格を提供し始めていて、トレーニングコースは募集開始後2日間で2000人の応募があったほどの人気だという。日本では若干遅れての提供開始となった。EMCジャパンはまた、立教大学と提携し、経営学部国際経営学科でビッグデータをテーマにした授業を開講することも発表している。

 トレーニングコース開設の背景を、EMCジャパン常務執行役員でストラテジー・アライアンス統括本部長の徳末哲一氏は「これまで企業は、購入データしか取得できなかったが、最近は(ソーシャルメディアなどにより)購入前や購入後のユーザーのデータも直接手に入れられるようになった」。このため従来のBIで行われてきたようなビジネスの事後検証だけでなく、予測を立てられる可能性が広がってきたことにあると説明している。

 今回の5日間のコースでは、分析手法については特に従来と変わったものを教えているわけではない。同コースの紹介ページに掲載されているのは、K平均法クラスタリング、関連性ルール、線形回帰、ロジスティック回帰、単純ベイズ分類器、決定木、時系列分析、テキスト分析だ。

emc01.jpg ビッグデータ時代には予測的分析が重要性を増すというのが、データサイエンティスト育成の基本的な考え

 だが、同コースを教えた米EMCのラジャラットナム・ガネッシュ(Rajaratnam Ganesh)氏は、コースの目的を、「ビジネス上の課題をどう考え、どう扱って最終的な成果を導き出すか」といった能力を開発することにあると話した。同コースでは、特に予測的分析に役立つ統計解析テクニックを扱う。しかし分析テクニックそのものよりも、事業にとって最適なシナリオは何か、この事象はなぜ起きているのか、このトレンドが続くと何が起こるのか、などを考えることをテーマとし、コース終了後すぐにでも、実際の分析プロジェクトに参加して貢献できることを目指しているという。このため、このコースでは演習に多くの時間が割かれている。

 ガネッシュ氏はデータアナリストの資質を5つ挙げている。「Quantitative」(物事を数学的命題として把握できる高い能力)、「Technical」(統計処理に活用できるIT技術に関する知識)、「Curious & Creative」(データの裏にストーリーを見い出せる能力)、「Skeptical」(自らを疑うことのできる能力)、「Communicative and Collaborative」(分析結果を事業につなげるためのコミュニケーション能力)だ。こうした資質のなかには生まれながらにして備えているもの、すでに獲得しているものもあるし、新たに習得できるものもあるとしている。不足している資質を、習得によって補うために、こうしたコースが必要だという。

(@IT 三木泉)

情報をお寄せください:

Server & Storage フォーラム 新着記事
@ITメールマガジン 新着情報やスタッフのコラムがメールで届きます(無料)

キャリアアップ

- PR -

注目のテーマ

ソリューションFLASH

「ITmedia マーケティング」新着記事

「パーソナライズド広告・販促」に企業は意欲的 でも、消費者の印象は……
KPMGジャパンは顧客体験価値を向上させる6つのテクノロジーについて調査を実施した。企業...

コロナ前に戻った「社会貢献意識」 2024年は過去最低の値に
博報堂生活総合研究所は、1992年から2年に一度実施している長期時系列調査「生活定点」の...

「令和の米騒動」でコメの代わりに買われたもの 読売広告社が購買実態を分析
読売広告社は、食品ID-POS購買行動データベース「real shopper」のデータから今夏のコメ...