マイクロソフトがデータサイエンスツール群の新バージョン「Data Science Utilities version 0.11」をリリース。Python対応の「IDEAR」が追加された。
米マイクロソフトは2017年1月11日(米国時間)、データサイエンスツール集の新バージョン「Data Science Utilities version 0.11」を2016年12月22日に正式リリースしたと告知した。Data Science Utilitiesは、データサイエンスにおけるコラボレーションやチーム学習を改善する同社のアジャイルで反復的な方法論「Team Data Science Process(TDSP)」における主要な要素の1つと同社は位置付けている。
TDSPは2016年9月に初期プレビューを発表、その一部としてData Science Utilities version 0.1も公開された。Data Science Utilities 0.1は、オープンソースの統計解析言語「R」をベースに、以下の2つのツールで構成されていた。
新バージョンのData Science Utilities 0.11では、「Python 2.7」で動作する「IDEAR in Jupyter Notebook(Python 2.7)」が追加された。
分析やデータサイエンスに使用される言語は、RとPythonが双璧であることから、Pythonにも対応したと同社。IDEAR in Jupyter Notebookは、IDEAR in Rの従来バージョンと同様の機能を利用可能。ユーザーはIDEAR in Jupyter NotebookをJupyter Notebookサーバにアップロードし、Jupyter Notebookのワーキングディレクトリを構成して、データセットの探索を開始できる。また、Pythonのipywidgetsライブラリを使って対話性が実現されている。
これに伴い、既存の「R」ベースのツールはそれぞれ「IDEAR in R」「AMAR in R」に表記を変更。併せて、IDEARとAMARにも、以下の機能追加や機能強化が行われた。
IDEAR in Rは、日時コンポーネント(年、月、平日、1年のうちの週数、時間など)を自動的に抽出し、元のデータセットに直接追加できるようになった。列名は末尾が「_autogen_year」「_autogen_month」などのようになる。
2016年9月にリリースされたバージョンのIDEAR in Rは、「RStudio」で実行する必要があった。今回、データサイエンスIDEとしてVisual Studio上の「RTVS」を好むユーザー向けに、この環境でIDEAR in Rを実行できるようにした。
Copyright © ITmedia, Inc. All Rights Reserved.