マイクロソフト、データサイエンスツール群「Data Science Utilities」の新バージョンを公開:IDEARがPythonにも対応
マイクロソフトがデータサイエンスツール群の新バージョン「Data Science Utilities version 0.11」をリリース。Python対応の「IDEAR」が追加された。
米マイクロソフトは2017年1月11日(米国時間)、データサイエンスツール集の新バージョン「Data Science Utilities version 0.11」を2016年12月22日に正式リリースしたと告知した。Data Science Utilitiesは、データサイエンスにおけるコラボレーションやチーム学習を改善する同社のアジャイルで反復的な方法論「Team Data Science Process(TDSP)」における主要な要素の1つと同社は位置付けている。
TDSPは2016年9月に初期プレビューを発表、その一部としてData Science Utilities version 0.1も公開された。Data Science Utilities 0.1は、オープンソースの統計解析言語「R」をベースに、以下の2つのツールで構成されていた。
- IDEAR(Interactive Data Exploration, Analysis and Reporting):データサイエンティストがデータセットを対話的に探索、可視化できるように支援するツール
- AMAR(Automated Modeling and Reporting):モデルの訓練、モデルのスイープ、パラメータのスイープを容易にするツール
新バージョンのData Science Utilities 0.11では、「Python 2.7」で動作する「IDEAR in Jupyter Notebook(Python 2.7)」が追加された。
分析やデータサイエンスに使用される言語は、RとPythonが双璧であることから、Pythonにも対応したと同社。IDEAR in Jupyter Notebookは、IDEAR in Rの従来バージョンと同様の機能を利用可能。ユーザーはIDEAR in Jupyter NotebookをJupyter Notebookサーバにアップロードし、Jupyter Notebookのワーキングディレクトリを構成して、データセットの探索を開始できる。また、Pythonのipywidgetsライブラリを使って対話性が実現されている。
これに伴い、既存の「R」ベースのツールはそれぞれ「IDEAR in R」「AMAR in R」に表記を変更。併せて、IDEARとAMARにも、以下の機能追加や機能強化が行われた。
IDEAR in Rで日時フィールドから日時コンポーネントを自動抽出可能に
IDEAR in Rは、日時コンポーネント(年、月、平日、1年のうちの週数、時間など)を自動的に抽出し、元のデータセットに直接追加できるようになった。列名は末尾が「_autogen_year」「_autogen_month」などのようになる。
新機能:IDEAR in Rが「Visual Studio」で「R Tools for Visual Studio(RTVS)」から実行可能に
2016年9月にリリースされたバージョンのIDEAR in Rは、「RStudio」で実行する必要があった。今回、データサイエンスIDEとしてVisual Studio上の「RTVS」を好むユーザー向けに、この環境でIDEAR in Rを実行できるようにした。
機能強化
- 「Azure Data Science Virtual Machine(DSVM)」で、IDEARをRとPythonの両方で実行しやすくなった
- IDEAR in Rが、「Hands-On Data Science Sharing R Code - With Style」のガイダンスに従った一貫性の高いコーディングスタイルを備えるようになった
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- データサイエンスを加速させる「TDSP」とは何か?
マイクロソフトが、データサイエンスの方法論などをまとめた「Team Data Science Process(TDSP)」を発表。データサイエンスのためのガイドラインやツールをGitHubで公開した。 - ITエンジニアがデータサイエンティストを目指すには?
それぞれの専門分野を生かした「データサイエンスチーム」を結成すればデータ活用への道は短縮できる。そのとき、ITエンジニアはどんな知識があればいい? データサイエンティストとして活動する筆者が必須スキル「だけ」に絞って伝授します。 - データ分析がデキるITエンジニアになるために必要な「道具」を揃える
データ分析の準備・加工に優れた道具とは? 今回はITエンジニアがデータ分析する際のデファクトスタンダードになっている環境をセットアップしていきます。 - 華々しい成果をすぐに出したい人は向いていない――データサイエンティスト
プログラマ、SE(システムエンジニア)、プロジェクトマネジャー――IT業界のさまざまな職業を紹介する本連載。第7回は、以前、米「ハーバード・ビジネス・レビュー」誌で今世紀で最もセクシーな職業と評された「データサイエンティスト」を解説する。