マイクロソフト、無償ディープラーニングツールキットの最新版「CNTK 1.5」を公開:音声認識などのディープラーニングモデルで、高い処理速度を実現
マイクロソフトは、プログラミング言語やツール機能、テキスト/音声読み取り機能を強化したオープンソースのディープラーニングツールキット「CNTK 1.5」をリリースした。
米マイクロソフトは2016年6月10日(米国時間)、AI(人工知能)技術を利用したディープラーニング(深層学習)ツールキット「Computational Network Toolkit(CNTK)」の最新版「CNTK 1.5」をリリースした。
GitHub Pagesで公開されているCNTK 1.5では、プログラミング言語の大幅な強化、ツール機能の拡充、テキスト及び音声の読み取り機能などが改良された。
マイクロソフトはCNTKの利点の1つに、GPUやマシンの追加によって効率的にスケールアップし、高い処理速度を実現できることを挙げている。CNTK 1.5では、「Block Momentum」と呼ばれる新しい並列処理技術を導入したことによって、訓練の精度を維持しながらも高いスケーラビリティを確保できるようになったという。この他、ネットワーク記述言語「BrainScript」にも新機能が追加され、「Sequence-to-Sequence with Attention」や、画像認識のための「Deep Residual Nets」といった標準コンポーネントライブラリも拡充されている。
マイクロソフトの主席研究者でCNTKのアーキテクトの1人であるフランク・サイド氏は、CNTK 1.5のポイントを次のように説明している。「CNTKは音声や画像の認識といったAI機能をアプリケーションに追加するための効率的で使いやすいツール。BrainScriptでは、非常に深いネットの表現やビームデコード、その他の複雑な構造が大幅に単純化された。また、中置演算子、ネストされた変数と関数定義、再帰的関数呼び出し、配列、さらにはラムダもサポートした」
マイクロソフトは、「CNTKを2016年1月にGitHubで公開して以来、コミュニティーから膨大なフィードバックが寄せられている。CNTK 1.5における改良の多くは、コミュニティーからの要望や貢献を直接反映したものだ」と述べている。今後もコミュニティーとの協力により、Pythonのような広く普及したプログラミング言語の追加など、CNTKの進化に取り組んでいくとしている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 「TensorFlowより高性能」なディープラーニングツールキット「CNTK」
米マイクロソフトリサーチが深層学習(ディープラーニング)ツールキットをオープンソースで公開。グーグルのTensorFlowよりもGPU性能を引き出せるという。 - AWS/Azure上でTensorFlow、CNTKを――機械学習環境のマネージドサービスが登場
クラスキャットが、機械学習環境のマネージドサービス「ClassCat Deep Learning Service v2」の提供を発表した。Amazon Web ServicesとMicrosoft Azureに対応する。 - もう絶望しない! ディープラーニングによる画像認識のビジネス活用事例
最近注目を浴びることが多くなった「Deep Learning」と、それを用いた画像に関する施策周りの実装・事例について、リクルートグループにおける実際の開発経験を基に解説していく連載。今回は、Deep Learning/CNN(Convolutional Neural Net)をどうビジネスに活用しているかに焦点を当て、その試行錯誤の過程を紹介します。