ITエンジニアがデータサイエンティストを目指すには?:ITエンジニアのためのデータサイエンティスト養成講座(1)(2/2 ページ)
それぞれの専門分野を生かした「データサイエンスチーム」を結成すればデータ活用への道は短縮できる。そのとき、ITエンジニアはどんな知識があればいい? データサイエンティストとして活動する筆者が必須スキル「だけ」に絞って伝授します。
フェイズ1:「分析手法の検討と準備」に必要なスキル
フェイズ1:「分析手法の検討と準備」に必要なスキル
基礎知識
- Statistics:統計学
- Linear Algebra:線形代数学
- Calculus :微分積分学
応用知識
- Regression Analysis:回帰分析
- Clustering Analysis:クラスタリング
- Time series Analysis:時系列分析
- Affinity Analysis:アソシエーション分析/マーケットバスケット分析
専門分野
- Operations Research:オペレーションズ・リサーチ
- Marketing Science:マーケティング・サイエンス
- Service Scienc:サービス・サイエンス
与えられたビジネス課題を解くための分析手法を検討して準備をします。いわゆる「仮説」を立てる部分です。複雑なケースでは幾つかの分析モデルを組み合わせて使用したり、新しい分析モデルを作り出す必要に迫られることもありますが、まずは基礎知識と応用知識で挙げたような内容が理解できていれば十分です。
実践的な応用が目的ですから全てを完ぺきに理解する必要はなく、基礎知識で挙げたものについては大学の教養課程などで使用した教科書を見直したり、あるいは「放送大学」などのカリキュラムで該当科目を視聴するなどで学ぶ(復習する)ことができます。また、応用知識で挙げたものについては、Webなどで得られる基本的な情報から「仕組み」が理解できていればまずは十分です。
さらに分析手法を突き詰めていくと、独自の分析モデルを構築して使用する必要もありますので、専門分野の部分で挙げたビジネス活動を科学的に理解するような学問や、広くは金融工学(Financial Engineering)や品質工学(Quality Engineering)など、特定の専門分野を深く追求していく必要が出てくるケースもあります。
フェイズ2:「データの準備と分析」に必要なスキル
フェイズ2:「データの準備と分析」に必要なスキル
基礎スキル
- Graph:データの視覚化
- Programming:プログラミング
- Relational Databases:リレーショナル・データベース
- Data mining:データマイニング・ツール
応用スキル
- Hadoop:大規模データ分散処理フレームワーク
- Stream Computing:ストリームコンピューティング
- Geospatial Data Analytics:地理データ分析
- Text Mining:テキストマイニング
- Computer Vision:パターン認識、画像解析
この部分は本連載第2回でも詳しく解説する予定ですが、「フェイズ1:分析手法の検討と準備」の分析手法を実際に計算する部分です。
プログラミングやデータベースなど、読者の皆さんがよくご存じの基本的なスキルから、最近では地図データやテキストデータ、画像データ・動画データを扱うためのスキルも必要になってきています。
またデータ処理のインフラストラクチャとしてビッグデータに対応するために、Hadoopのような大規模なデータを分散処理するためのスキルや、ストリームコンピューティングのように、ネットワークを流れるデータをリアルタイムに処理するような技術の必要性も、今後どんどん多くなっていくことでしょう。
フェイズ3:「プレゼンテーション」に必要なスキル
フェイズ3:「プレゼンテーション」に必要なスキル
基礎スキル
- コミュニケーション・スキル
- Excel:エクセル
- PowerPoint:パワーポイント
応用スキル
- 3次元グラフ
- 地図
分析結果が得られたら、ビジネスユーザーやマネジメント層にプレゼンをして理解してもらうことも、データサイエンティストの重要な役割の1つです。
また、分析内容の高度化、複雑化に伴って、結果を3次元で立体的に表現したり地図上でプレゼンテーションするといった、新しいプレゼン手法も積極的に取り入れていく必要があります。
フェイズ4:「結果の検証」に必要なスキル
必要なスキルという点ではフェイズ1と同じです。分析結果に基づいて何らかの意思決定やアクションが行われますので、その結果を検証しフェイズ1へ戻り、新たな分析サイクルを実施しモデルを修正したり新たなデータを加えながら分析の精度を向上させていきます。ビジネスの環境は常に変化を続けていますので、分析も1度きりではなく仮説と検証を繰り返しながら変化に追随することが重要です。
*** 一部省略されたコンテンツがあります。PC版でご覧ください。 ***
ミニマムで立ち上げるために
このように、ITエンジニアに必要なスキルを、主なものだけを挙げても、その対象が非常に広範囲に渡ることが理解いただけたと思います。しかし、これら全てを最初から理解してデータ分析を行うことは、ほぼ不可能に近いといってもよいでしょう。そこで、この連載では必要最低限の知識とスキルでスタートできることを中心にご紹介していきます。
第1回のまとめ
今回は、データサイエンティストの役割を説明し、その中でITエンジニアが担う役割と必要となるスキルについて解説しました。この連載では必要最低限の知識とスキルを中心に紹介し、読者の皆さんにすぐに始められることから実際に着手していただくことを望んでいます。
いきなり高度な分析を目指すよりも、分析結果を利用してスピーディなアクションや意思決定を行い結果を検証しフィードバックするというプロセスを「継続」していくことが重要です。
次回は、分析環境の準備について具体的な解説していきますのでお楽しみに。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- ビッグデータインフラのパズルを埋めるラインアップと「5つのシナリオ」
近いうちに多くの企業がビッグデータ活用企業になる――その時あなたの会社はどうする? 今年の「Information On Demand Conference Japan 2013」はビッグデータ活用をより手軽に、身近にするための情報が多数見られたようだ。 - Database Expertレポート(1):シゴトで使える「データサイエンティスト」に必要なスキルセットってどんなもの?
データサイエンティスト育成プログラムの先生に、使えるスキルセットって何だろう、という疑問をぶつけてみた。いわく、座学だけじゃ不十分なのだそうです。 - Hadoopシステムのエンドユーザーコンピューティングをマイクロソフトが考えると? Parallel Datawarehouseのアプローチ
マイクロソフトがMPP型DWHソリューションを考えると? Apache Hadoopベースの非構造データを取り込むことを前提としたSQL Serverのビッグデータ対応はエンドユーザーコンピューティングを意識した内容に。