データサイエンティストに求められるスキルを、一般社団法人データサイエンティスト協会が公開している「スキルセット」に基づいて説明しよう。
1つ目は「ビジネス力」。課題背景を理解した上で、ビジネス課題を整理し、解決する力である。
2つ目は「データサイエンス力」。情報処理、人工知能、統計学などの情報科学系の知恵を理解し、使う力である。
3つ目は「データエンジニアリング力」。データサイエンスを、実装、運用できるようにする力だ。特に最近は、膨大で多種多様なデータ、すなわち「ビッグデータ」を処理・加工するためのデータエンジニアリングのスキルが多く求められるようになった。
1人がこの3つを完璧に習得することは難しい。自分の得意分野を核にして、実務に取り組みながら他の2つのスキルアップを目指すのが現実的だ。
統計学の修士号・博士号を持つ人というイメージで語られることが多いが、世界のトップ企業で最新のアルゴリズムを研究するのでない限り、その必要はないだろう。文系でも経済学や心理学など数理モデルを扱う分野は多く、必ずしも理系出身である必要はない。理論的なモデルを扱うことに興味があり、「探究心」が旺盛であればよい。
むしろ多くの企業では、探究心に加えて「ビジネスへの関心」と「コミュニケーション力」を備えていることが求められるだろう。
地道な作業が求められる分野なので、華々しい成果をすぐに出したい人は向かないかもしれない。
データサイエンティストは具体的にはどのような仕事を行っているのか。ここでは1つの例として、ある会社でマーケティングデータの分析を担当するAさんの、1週間の活動を紹介しよう。
曜日 | 活動内容 |
---|---|
月曜日 | 午前中 チームの定例会議で仕事の現状と課題を報告 午後 先週行ったWebログの分析結果を元に、翌日のミーティングの資料を作成する |
火曜日 | マーケティング施策の推進担当者にこれまでの分析結果を報告し、今後の分析方針について提案・説明を行う。売上向上に向けてどのような販売施策が必要なのか、そのために、追加でどのような分析をすべきかが議論となった |
水曜日 | 午前中 データベースから追加のデータを抽出して分析できる形に加工する作業に没頭 午後 「大量の文章データをどう処理するか」をチーム内で議論。オープンソースのデータ処理技術を使うか否かが問題となり、試験導入を決めた |
木曜日 | データの加工作業の続きを行う。加工処理のためのプログラミングがうまく動かず、チーム内で詳しい人に相談し何とか解決した 夜は社外の有志勉強会に参加し、人工知能技術の応用について講義を聞く |
金曜日 | 加工したデータを元に統計分析を数回実行し、分析結果をグラフ化。結果から何がいえるのか、どのような販売施策を提案すべきかを検討しメモを書く。来週の会議資料作成に向けてマーケティング戦略の本を家に持ち帰り、週末読むことにする。 |
1週間の例を見ると、分析の前段階ではデータの加工など地味な作業が多いことが分かる。また、ビジネス視点で施策を検討・提案するなど、多面的な視野がデータサイエンティストには必要だ。
野村総合研究所 戦略IT研究室 主任研究員
野村総合研究所システムコンサルティング事業本部にて、企業のIT活用動向とIT戦略に関わる調査・研究を担当、国内のITユーザー企業を対象としたIT活用実態調査の実施に携わる。また、人間科学分野でデータ分析を学んだ経験から、企業内でデータの分析・活用に基づく課題解決が定着するよう施策検討を行っている。データ分析の社内研修講師も手掛ける。
Copyright © ITmedia, Inc. All Rights Reserved.