Microsoft、オープンソースのAIデバッグ/可視化ツール「TensorWatch」を発表:カスタムUIでストリームを高度に活用
Microsoft Researchは、データサイエンスやディープラーニング、強化学習向けにオープンソースのデバッグ/可視化ツール「TensorWatch」を発表した。Jupyter NotebookをUIに利用しているため、カスタマイズが容易だという。
Microsoft Researchは2019年6月25日(米国時間)、データサイエンスやディープラーニング、強化学習向けにオープンソースのデバッグ/可視化ツール「TensorWatch」を発表した。TensorWatchは「Jupyter Notebook」で動作し、機械学習(ML)トレーニングのリアルタイム可視化や、モデルとデータの重要な分析タスクを実行する。
Microsoft ResearchはTensorWatchを、「研究者やエンジニアの仕事に役立つ先進的機能を数多く提供する、デバッグツールのスイスアーミーナイフ」とうたっている。2019年6月にスペインのバレンシアで開催された「ACM SIGCHI Symposium on Engineering Interactive Computing Systems」で、TensorWatchのプレゼンテーションを行ったという。
Microsoft ResearchによればTensorWatchの特徴は次の通り。
カスタムUIの作成や可視化に向く
TensorWatchは、あらかじめ組み込まれたUIではなく、Jupyter NotebookをUIに利用している。具体的にはJupyter Notebookの構成可能なUIや、Jupyter Labの共有可能なライブダッシュボードを使用して、リアルタイムトレーニングプロセスの対話型デバッグ機能を提供する。
さらにTensorWatchはPythonライブラリであるため、独自のカスタムUIを作成したり、巨大なPythonデータサイエンスエコシステムの中で利用したりできる。なお、TensorWatchは幾つかの一般的なタイプの可視化(棒グラフ、ヒストグラム、円グラフ、3Dバリエーションなど)もサポートしている。

Jupyter Notebookで動作しているTensorWatchがMLトレーニングアプリケーションで生成される複数のストリームからライブチャートをレンダリングしているところ(クリックで再生、出典:Microsoft)
ストリームを高度に活用できる
TensorWatchアーキテクチャの核となるコンセプトは、データや他のオブジェクトをストリームとして統一的に扱うというものだ。ストリームとして扱われる対象には、ファイルやコンソール、ソケット、クラウドストレージ、さらには可視化自体も含まれる。
TensorWatchストリームは共通インタフェースにより、他のストリームをリッスンでき、カスタムデータフローグラフの作成が可能になる。
これによってTensorWatchでは、さまざまな高度なシナリオを実装できる。例えば、多くのストリームを同じ方法で可視化したり、1つのストリームを同時に多くの方法で可視化したり、1つのストリームを多くのファイルとして永続化したり、あるいはしなかったり、といったことが可能だ。
遅延ロギングモードを導入
Microsoft ResearchはTensorWatchで「遅延ロギングモード」を導入した。このモードでは、前もって全ての情報のログを取る必要がない。代わりに、TensorWatchに変数を「監視」させることができる。
監視を行うに当たって基本的には制約がなく、好きなだけ多くの変数を追跡できる。さらに、こうした変数のコンテキストで対話型クエリを実行でき、ストリームが結果として返ってくる。これらのストリームは、必要に応じて可視化や保存、処理が可能だ。
モデル開発の全フェーズをサポート
Microsoft Researchは、モデル開発の全フェーズ(トレーニング前、トレーニング中、トレーニング後)でデバッグ機能の改良に力を入れており、特にトレーニング前とトレーニング後のフェーズで役立つさまざまな機能を提供している。
これらの機能の多くは、幾つかの優れたオープンソースライブラリを利用して実現した。その中には、モデルグラフ可視化や次元圧縮によるデータ探索、モデル統計、畳み込みネットワークの予想などのライブラリが含まれる。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
機械学習を用いた予測分析ソフトウェア「Prediction One」を無償提供 ソニー
ソニーは機械学習を用いた予測分析ソフトウェア「Prediction One」を、法人向けに無償提供する。利用者にデータ処理に関する専門知識や経験がなくても、精度の高い予測が可能。VS CodeからJupyter Notebookを使ってみよう
Python人気を支えるツールの1つ「Jupyter Notebook」。VS Codeからこれを使ってみよう。Jupyter拡張機能が提供する機能も一覧する。NVIDIA、大規模データ分析や機械学習向けGPUアクセラレーションプラットフォーム「RAPIDS」を公開
NVIDIAは、大規模データアナリティクスや機械学習のパフォーマンスを高めるオープンソースソフトウェア(OSS)のGPUアクセラレーションプラットフォーム「RAPIDS」を公開した。