マイクロソフト、データサイエンスツール群「Data Science Utilities」の新バージョンを公開IDEARがPythonにも対応

マイクロソフトがデータサイエンスツール群の新バージョン「Data Science Utilities version 0.11」をリリース。Python対応の「IDEAR」が追加された。

» 2017年01月13日 11時00分 公開
[@IT]

 米マイクロソフトは2017年1月11日(米国時間)、データサイエンスツール集の新バージョン「Data Science Utilities version 0.11」を2016年12月22日に正式リリースしたと告知した。Data Science Utilitiesは、データサイエンスにおけるコラボレーションやチーム学習を改善する同社のアジャイルで反復的な方法論「Team Data Science Process(TDSP)」における主要な要素の1つと同社は位置付けている。

 TDSPは2016年9月に初期プレビューを発表、その一部としてData Science Utilities version 0.1も公開された。Data Science Utilities 0.1は、オープンソースの統計解析言語「R」をベースに、以下の2つのツールで構成されていた。

  • IDEAR(Interactive Data Exploration, Analysis and Reporting):データサイエンティストがデータセットを対話的に探索、可視化できるように支援するツール
  • AMAR(Automated Modeling and Reporting):モデルの訓練、モデルのスイープ、パラメータのスイープを容易にするツール

 新バージョンのData Science Utilities 0.11では、「Python 2.7」で動作する「IDEAR in Jupyter Notebook(Python 2.7)」が追加された。

 分析やデータサイエンスに使用される言語は、RとPythonが双璧であることから、Pythonにも対応したと同社。IDEAR in Jupyter Notebookは、IDEAR in Rの従来バージョンと同様の機能を利用可能。ユーザーはIDEAR in Jupyter NotebookをJupyter Notebookサーバにアップロードし、Jupyter Notebookのワーキングディレクトリを構成して、データセットの探索を開始できる。また、Pythonのipywidgetsライブラリを使って対話性が実現されている。

photo IDEARがPythonに対応

 これに伴い、既存の「R」ベースのツールはそれぞれ「IDEAR in R」「AMAR in R」に表記を変更。併せて、IDEARとAMARにも、以下の機能追加や機能強化が行われた。

IDEAR in Rで日時フィールドから日時コンポーネントを自動抽出可能に

 IDEAR in Rは、日時コンポーネント(年、月、平日、1年のうちの週数、時間など)を自動的に抽出し、元のデータセットに直接追加できるようになった。列名は末尾が「_autogen_year」「_autogen_month」などのようになる。

photo IDEAR in Rで日時コンポーネントの自動抽出が可能に

新機能:IDEAR in Rが「Visual Studio」で「R Tools for Visual Studio(RTVS)」から実行可能に

 2016年9月にリリースされたバージョンのIDEAR in Rは、「RStudio」で実行する必要があった。今回、データサイエンスIDEとしてVisual Studio上の「RTVS」を好むユーザー向けに、この環境でIDEAR in Rを実行できるようにした。

機能強化

  • 「Azure Data Science Virtual Machine(DSVM)」で、IDEARをRとPythonの両方で実行しやすくなった
  • IDEAR in Rが、「Hands-On Data Science Sharing R Code - With Style」のガイダンスに従った一貫性の高いコーディングスタイルを備えるようになった

Copyright © ITmedia, Inc. All Rights Reserved.

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。