ITエンジニアがデータサイエンティストを目指すには?:ITエンジニアのためのデータサイエンティスト養成講座(1)(1/2 ページ)
それぞれの専門分野を生かした「データサイエンスチーム」を結成すればデータ活用への道は短縮できる。そのとき、ITエンジニアはどんな知識があればいい? データサイエンティストとして活動する筆者が必須スキル「だけ」に絞って伝授します。
はじめに:分析スキルの課題をどう乗り越えるべき?
昨今では、IT系のメディアのみならず一般雑誌や新聞なども“ビッグデータ”というキーワードを見出しに使っています。この文字を目にしない日がないくらいに多用されていて“バズワード”としてとらえられるケースも少なからずあるようです。
しかし、世界の至る所で――もちろん日本でも、ビッグデータを分析することで新たな知見を見つけて利益を増大した企業や、顧客の購買行動を予測することで売り上げを拡大した“成功企業”も確実に存在します。そして、多くの企業経営者は自社の差別化の要素の1つとして真剣に取り組んでみたいと切望しています。
しかし、実際にデータ分析への取り組みを考える企業の多くが直面する課題が“分析スキル”で、最近ではこの課題を解決するための人材として“データサイエンティスト”と呼ばれる職種に注目が集まり、最もセクシーな職種ともてはやされています。「5年後には14〜19万人不足する」(米マッキンゼー)注1とか「統計学が重要だ」という断片的で抽象的な情報は多くありますが、具体的にどのようなスキルが必要なのか、どうやって学べば良いのかという情報はほとんどありません。
本連載では“データサイエンティスト”の役割について説明し、その中でも技術的な素養を持つITエンジニアが担うべき役割と必要となるスキルについて解説していきます。ツールとして、主にPython言語を使い、データの抽出やクレンジング・変換といった分析のために必要なデータの準備フェイズから分析後のプレゼンテーションの方法までを包括的に具体的に解説し、ITエンジニアのスキルアップの参考にしていただくことを目指します。
注1 「Big data: The next frontier for innovation, competition, and productivity」(McKinsey Global Institute、 2011年5月、リンク)
データサイエンティストの役割
冒頭でも述べましたが、データサイエンティストの基本的な役割は、ビッグデータに限らずデータを分析して、ビジネスに役立つ洞察や課題を解決する知見を見つけ出し、有効なアクションにつなげていくことです。こうやってひと言で表現すると至極簡単ですが、1人のITエンジニアやビジネスユーザーが担うには、業務の範囲においても知識やスキルの深さにおいても、「スーパーマン」が必要です。
スーパーマン育成プログラムが出現する一方で、育成機関の問題が
例えば米国では、グレイロック・パートナーズ注2という、GoogleやFacebook、LinkedInなどの躍進著しいIT企業に投資を行っている会社では「DATA SCIENCE FELLOWS PROGRAM」注3という、博士号を有する人に対しての特別なプログラムを用意して人材を育成し、投資先の企業への人材供給を進めています。まさに前述のスーパーマンを育成するプログラムですが、候補となる人材や育成する時間の観点などから、このプログラムを活用できる日本企業はわずかです。
1人のスーパーマンではなく「データサイエンス・チーム」を作る
ではいったいどうすれば良いのでしょうか? このような課題に対して、筆者は、いまの組織を拡張したりバーチャルな組織を編成することからスタートすることをお勧めします。“データサイエンティスト”が担う役割を細分化し、チームとしてデータ分析の課題を解決する手法です。
図1にあるように、ビジネス・オペレーションや意思決定の中にデータ分析を組み込んで実行することのできる(1)「経営・マネジメント」のメンバー、ビジネスに関する勘や経験を持ちデータに対するセンスを持つ(2)「ビジネスユーザー」、そして分析手法や分析ツールを駆使して実際に分析を行う(3)「ITエンジニア」の、大きく分けると3つのタイプの役割を担うメンバーを集めた組織を編成し、“データサイエンス・チーム”として活動していくことが早期に結果を出すための近道の1つです。
データサイエンス・チーム:ITエンジニアの役割とは?
それでは、この中でITエンジニアの担う役割とは何でしょうか? 実際にはこの3つの役割をきっちり分割・分業できるわけではありませんから明確に定義することはできませんが、一番重要な役割は「問題を解くための適切な手法を選択して、実際に計算し、答えを出すこと」です。時にはこれまでになかった分析モデルを構築する必要に迫られる場面もあると思いますが、計算して定量的な答えを出すことが、データサイエンス・チームにおけるITエンジニアの役割です。
ITエンジニアに必要となるスキル
ではITエンジニアがデータサイエンス・チームで活躍するために必要な具体的なスキルとは何でしょうか?
前述のグレイロック・パートナーズの「DATA SCIENCE FELLOWS PROGRAM」や、大学教育の分野であればノースカロライナ州立大学が実施している「MASTER OF SCIENCE IN ANALYTICS」注4という修士コースのカリキュラムが参考になりますが、ビッグデータにも対応した先進的なスキルも含めた全てのスキルを網羅的に学ぼうとすると、かなり広範囲な内容をカバーする必要があります。
ITエンジニアの仕事は大きく4つのフェイズに分けられ、それぞれのフェイズで必要となる代表的なスキルを挙げてみました。
Copyright © ITmedia, Inc. All Rights Reserved.