Microsoftは、開発者がアプリケーションにAI機能を組み込めるローカルAI実行基盤「Foundry Local」の一般提供を開始した。ユーザーの端末上でAI処理を完結させる仕組みにより、クラウドへの依存やネットワーク遅延、トークン課金が発生しないAI実装が可能になるという。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
Microsoftは2026年4月9日(米国時間)、クロスプラットフォームのローカルAI実行基盤「Foundry Local」の一般提供を開始したと発表した。
チャットや音声などのモダリティ(データ種別)に対応し、デスクトップアシスタント、医療意思決定支援ツール、プライベート環境でのコーディング支援、オフライン対応のエッジアプリケーションなどに、本番運用レベルのAIをユーザーの端末上で完全に動かせるという。
「Microsoft Foundry」は、クラウドからエッジまでを幅広くカバーするプラットフォームだ。クラウド上の最先端モデルやエージェント、ファインチューニング向けのクラウド版から、Azure Localで検証されたオンプレミスや分散環境に対応するFoundry Local、「Windows」「macOS」「Android」など各種端末上でネイティブ動作するFoundry Localまでを含む。
Microsoft Foundryのローカル実行環境であるFoundry Localは、アプリケーションのインストーラーに直接バンドルしてもダウンロードサイズへの影響が少ない、約20MBの軽量パッケージとして提供される。
依存関係ゼロで完結したAI搭載アプリケーションを、通常のデスクトップアプリケーションやエッジアプリケーションと同様に配布でき、サイズ肥大化を防ぐことができるという。
なお、Foundry Localはエンドユーザー端末での軽量なシングルユーザー推論に焦点を当てており、複数ユーザーからの同時リクエストを処理するサーバ推論スタックとしては設計されていない点には留意が必要だ。
開発者はアプリケーションコード内に、Python、JavaScript、C#、RustのFoundry Local SDK(ソフトウェア開発キット)をインストールして利用する。SDKをインストールするとFoundry Local Coreと機械学習モデル用オープンフォーマット「ONNX Runtime」のバイナリが自動的にダウンロードされ、アプリケーションのビルド時に依存関係としてバンドルされる。
SDKはFoundry Local Coreネイティブライブラリの薄いラッパーで、モデルのライフサイクル(ダウンロード、メモリへの読み込み、推論管理、アンロード)を管理する。
Foundry Localは、Foundryカタログと統合され、初回実行時にデバイスハードウェアに最適化されたモデルをダウンロードする。以降は、モデルはユーザーのデバイス上のローカルキャッシュからロードされる。
対応プラットフォームは「Windows」「Linux」「macOS」の3種類。Windowsでは「Windows ML」(Windows Machine Learning)と統合し、OSやWindows Update経由でハードウェアに適合する実行プロバイダープラグインを取得する仕組みで、ユーザーがドライバーをインストールする必要はない。
macOSではAPI「Metal」経由でApple Silicon GPU上でネイティブ動作する。推論APIはOpenAI互換のリクエスト/レスポンス形式やOpen Responses APIフォーマットに対応しており、ローカルでHTTP Webサーバを立ち上げる複雑なインフラ構築なしに、クラウドと端末上の推論をシームレスに切り替えられる。
Foundry Localの主な機能は次の通り。
Microsoftは、Azure Localを基盤とするFoundry LocalによるRAG(検索拡張生成)やチャットを含むエージェント型AI機能を、顧客所有の分散インフラ向けにプレビュー提供している。今後は対応モデルの拡充、リアルタイム音声認識(マイクからのライブ字幕生成など)、複数アプリケーション間でのモデル共有を可能にする共有キャッシュの強化を予定している。
「Visual Studio Code」と「Ollama」で簡単に始められる、安心・安全なローカルAI活用術
WindowsはローカルAIやエージェント機能の強化でどんなOSに変わるのか 「Ignite 2025」発表まとめ
AIエージェントに疑問視? Microsoftが「マルチタスク」の課題を指摘
トークン破産、情報漏えい、LLM実行遅延――全部「AI Gateway」に任せよう 無料枠で学ぶAIエージェント開発、運用の新常識
あらゆるアプリにAIエージェント機能を組み込める「GitHub Copilot SDK」発表Copyright © ITmedia, Inc. All Rights Reserved.