Microsoft Researchは、データサイエンスやディープラーニング、強化学習向けにオープンソースのデバッグ/可視化ツール「TensorWatch」を発表した。Jupyter NotebookをUIに利用しているため、カスタマイズが容易だという。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
Microsoft Researchは2019年6月25日(米国時間)、データサイエンスやディープラーニング、強化学習向けにオープンソースのデバッグ/可視化ツール「TensorWatch」を発表した。TensorWatchは「Jupyter Notebook」で動作し、機械学習(ML)トレーニングのリアルタイム可視化や、モデルとデータの重要な分析タスクを実行する。
Microsoft ResearchはTensorWatchを、「研究者やエンジニアの仕事に役立つ先進的機能を数多く提供する、デバッグツールのスイスアーミーナイフ」とうたっている。2019年6月にスペインのバレンシアで開催された「ACM SIGCHI Symposium on Engineering Interactive Computing Systems」で、TensorWatchのプレゼンテーションを行ったという。
Microsoft ResearchによればTensorWatchの特徴は次の通り。
TensorWatchは、あらかじめ組み込まれたUIではなく、Jupyter NotebookをUIに利用している。具体的にはJupyter Notebookの構成可能なUIや、Jupyter Labの共有可能なライブダッシュボードを使用して、リアルタイムトレーニングプロセスの対話型デバッグ機能を提供する。
さらにTensorWatchはPythonライブラリであるため、独自のカスタムUIを作成したり、巨大なPythonデータサイエンスエコシステムの中で利用したりできる。なお、TensorWatchは幾つかの一般的なタイプの可視化(棒グラフ、ヒストグラム、円グラフ、3Dバリエーションなど)もサポートしている。
TensorWatchアーキテクチャの核となるコンセプトは、データや他のオブジェクトをストリームとして統一的に扱うというものだ。ストリームとして扱われる対象には、ファイルやコンソール、ソケット、クラウドストレージ、さらには可視化自体も含まれる。
TensorWatchストリームは共通インタフェースにより、他のストリームをリッスンでき、カスタムデータフローグラフの作成が可能になる。
これによってTensorWatchでは、さまざまな高度なシナリオを実装できる。例えば、多くのストリームを同じ方法で可視化したり、1つのストリームを同時に多くの方法で可視化したり、1つのストリームを多くのファイルとして永続化したり、あるいはしなかったり、といったことが可能だ。
Microsoft ResearchはTensorWatchで「遅延ロギングモード」を導入した。このモードでは、前もって全ての情報のログを取る必要がない。代わりに、TensorWatchに変数を「監視」させることができる。
監視を行うに当たって基本的には制約がなく、好きなだけ多くの変数を追跡できる。さらに、こうした変数のコンテキストで対話型クエリを実行でき、ストリームが結果として返ってくる。これらのストリームは、必要に応じて可視化や保存、処理が可能だ。
Microsoft Researchは、モデル開発の全フェーズ(トレーニング前、トレーニング中、トレーニング後)でデバッグ機能の改良に力を入れており、特にトレーニング前とトレーニング後のフェーズで役立つさまざまな機能を提供している。
これらの機能の多くは、幾つかの優れたオープンソースライブラリを利用して実現した。その中には、モデルグラフ可視化や次元圧縮によるデータ探索、モデル統計、畳み込みネットワークの予想などのライブラリが含まれる。
Copyright © ITmedia, Inc. All Rights Reserved.