Microsoft、ブラウザでAI推論が可能になる「WebNN」を解説 「次世代のWeb開発において重要な役割を果たす」:アーキテクチャの概要、ユースケースとは?
Microsoftは公式ブログで、Webアプリケーションでニューラルネットワーク推論タスクを効率的に実行できるJavaScript APIである「WebNN」の概要やアーキテクチャ、メリットなどを解説した。
Microsoftは2024年6月24日(米国時間)に公式ブログで、Webアプリケーションでニューラルネットワーク推論タスクを効率的に実行できるJavaScript APIである「WebNN(Web Neural Network API)」について、概要やアーキテクチャ、メリットなどを解説した。
Microsoftは「WebNNは、Web開発者がWebアプリケーション内でニューラルネットワークの機械学習(ML)処理を直接実行できるようにするJavaScript APIだ」とした上で「WebNNはMLモデルのWebアプリケーションへの統合を簡素化し、ブラウザ上で動作するインタラクティブでインテリジェントなアプリケーションの新しい可能性を開くものだ」と述べている。
WebNNは、2024年7月時点で、インターネット標準を策定するW3C(World Wide Web Consortium)の勧告候補(Candidate Recommendation)となっている。
Microsoftは、WebNNの概要やメリット、アーキテクチャの概要、活用の可能性について次のように解説している。
WebNNとは
ソフトウェアとハードウェアの両方のエコシステムで新しいML技術が登場する中で、Webにとっての主な課題の一つは、ソフトウェアとハードウェアの開発を橋渡しし、ハードウェアプラットフォーム全体に拡張し、ユーザーがWebベースでMLの効果を体験するためにあらゆるフレームワークで動作するソリューションを提供することにある。
WebNNは、Webアプリケーションにおけるニューラルネットワーク推論の高速化のために設計された、ハードウェアに依存しない抽象化レイヤーだ。主にトレーニングよりも推論タスクを対象としている。これにより、Webアプリケーションは、CPU、GPU、専用AI(人工知能)アクセラレーターなど、さまざまなデバイス上でML処理を効率的に実行できる。
開発者はWebNNを活用してWebアプリケーションで推論タスクを実行し、レイテンシの削減、プライバシーの強化、GPUアクセラレーションの恩恵を受けることができる。WebNNは、WebサイトやWebアプリケーション内でAI機能を直接実行するためのインタフェースを提供する。
WebNNのアーキテクチャ
WebNNのアーキテクチャ(下図)は、WebNNがWebベースのMLワークフローの各種コンポーネントとどう統合されるかを示している。
Webアプリケーションレイヤー
開発者は、事前にトレーニングされたモデル(ONNXやTensorFlowなど)とJavaScript MLフレームワーク(TensorFlow.jsやONNX.jsなど)を使用して、ML機能を備えたWebアプリケーションを構築できる。
Webブラウザレイヤー
Webアプリケーションは、WebNN APIをサポートするWebブラウザで実行される。ブラウザは、高性能計算のためにWebGPUを利用し、ニューラルネットワーク推論のためにWebNNを使用し、パフォーマンスが重要なコードを実行するためにWebAssemblyを活用できる。
ネイティブML APIレイヤー
ブラウザ内のWebNN APIは、高レベルのニューラルネットワーク操作を、OSが提供するネイティブのML APIへの呼び出しに変換する。これにより、Webアプリケーションは、macOS、Windows、Android、Linuxのどれで実行されても、デバイスで利用可能な最良のハードウェアアクセラレーションを活用できる。
ハードウェアレイヤー
ネイティブのML APIは、ニューラルネットワークの計算を効率的に実行するために、CPU並列処理、GPUアクセラレーション、またはML専用アクセラレーターなどの基礎となるハードウェア機能を利用する。
WebNNアーキテクチャのメリット
ハードウェアに依存しない
WebNNはハードウェアに依存しないレイヤーを提供するため、開発者はプラットフォーム固有のコードを書く必要がない。同じWebアプリケーションを異なるデバイスやOS上で効率的に実行できる。
パフォーマンスの最適化
ネイティブのML APIとハードウェアアクセラレーションを活用することで、WebアプリケーションはMLタスクで高いパフォーマンスが実現できる。
プライバシー
データはデバイス上に保存されるため、機密情報をリモートサーバに送信する必要性が減少する。
レイテンシの削減
ブラウザ内での推論により、サーバとデータの送受信に伴う遅延が減少し、ビデオ分析や顔認識などのリアルタイムアプリケーションが可能になる。
以下のサンプルコードは、WebNNの簡単な使い方を示している。
Microsoftは「顔認識や顔ランドマーク検出、画像分類、物体検知、音声ノイズ抑制、背景除去、領域分類といったユースケースにおいてWebNNが活用できる。エッジAI機能、インタラクティブな体験の提供、プライバシー重視のAI機能の提供など、次世代のWeb開発において重要な役割を果たすだろう」と述べている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
Cloudflare、AI推論のデプロイプラットフォーム「Workers AI」の正式リリースなどを発表
Cloudflareは、AI推論を大規模にデプロイするためのプラットフォームである「Workers AI」の一般提供開始や、Hugging Faceとの提携拡大によって、ワンクリックでAIモデルを「Hugging Face」プラットフォームからグローバルにデプロイできるようになったことなどを発表した。RAG実装時に「あったらいいな」をそろえた多機能アプリ デロイト トーマツ コンサルティングが開発
デロイト トーマツ コンサルティングは、RAGの利便性や精度を高める複数技術を実装したアプリケーションを開発した。検索精度向上のための機能や、大規模言語モデル(LLM)の回答分野拡張のための機能、回答精度向上のための機能を備える。生成AIの活用を検討する企業が「RAG」を導入すべき5つの理由 Cohere
Cohereは、企業が生成AI活用を推進する上でRAGが重要な役割を果たすとし、5つの理由を解説した。