GoogleとIntelが共同開発、Intel GPUでJAXモデルを高速化するPJRT API登場:AIフレームワークへのハードウェア最適化が容易に
GoogleはPJRTの初のプラグインPJRT APIをIntelと共同開発したことを発表した。PJRT APIを実装することでIntel GPU上でのJAXモデルの実行や、XLAアクセラレーションを使用したTensorFlowおよびPyTorchモデルの初期Intel GPUサポートも可能になる。
Googleは2023年6月1日(米国時間)、Intel GPU上でJAXモデルをシームレスに実行する「Intel Extension for TensorFlow」で、初のPJRT(Performance JIT Runtime)プラグインの実装を発表した。PJRT APIは別途開発されたIntel GPUプラグインとの統合を簡素化し、JAXへの迅速な統合を可能にする。また、PJRTの実装により、XLAアクセラレーションを備えたTensorFlowとPyTorchモデルの初期Intel GPUサポートも有効になる。
IntelとGoogleは共同でTensorFlow PluggableDeviceメカニズムを開発した。このメカニズムはTensorFlowを新しいデバイスに拡張するためにサポートされた手法であり、ハードウェアベンダーはこれを使用して、独自のプラグインバイナリのリリースが可能になる。Intelは、XLAコンパイラ用のモジュラーインタフェースの構築や、IntelGPU上でJAXワークロードを実行するためのPJRTプラグインの開発でGoogleと協力を続けている。
JAX
JAXは、GPUやTPUなどのハイパフォーマンスコンピューティングデバイスでの複雑な数値計算のために設計されたオープンソースのPythonライブラリである。NumPy関数をサポートし、自動微分や、ニューラルネットワークを構築、訓練するためのコンポーザブル関数変換システムを提供する。
関連記事
- Google Cloud、クラウド開発環境「Cloud Workstations」正式リリース OSS版VS Codeも利用可能
Google Cloudは、クラウド上で完全に管理された安全な開発環境を提供する「Cloud Workstations」の一般提供を開始した。 - Metaが次世代AIインフラ構築計画の進捗状況を発表 カスタムAIアクセラレータチップ、次世代DCなど
Metaは、次世代AIインフラを構築する計画の最近の進捗状況を発表した。発表の目玉は、AIモデルを実行するための同社初のカスタムシリコンチップ、AIに最適化された新しいデータセンター設計、1万6000個のGPUを搭載するAI研究用スーパーコンピュータの第2フェーズだ。 - Google、分散アプリケーションを構築・デプロイするOSSフレームワーク「Service Weaver」発表
Googleは、分散アプリケーションを構築、デプロイ(展開)するためのオープンソースフレームワーク「Service Weaver」を発表した。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.