Intel、生成AI活用を支援する「Gaudi 3」や「Xeon 6プロセッサー」を発表:エンタープライズ向けAIデータセンター市場への展開を拡大
Intelは年次イベント「Intel Vision 2024」において、同社のAIアクセラレーター「Gaudi 3」や、データセンター向け「Xeon 6プロセッサー」など生成AIに関連する新製品を発表した。
Intelは2024年4月9日(米国時間)、年次イベント「Intel Vision 2024」において、オープンかつスケーラブルな製品群による包括的なエンタープライズ向けAI(人工知能)戦略を公開した。これには、同社のAIアクセラレーター「Gaudi」の最新世代となる「Gaudi 3」や、データセンター向け「Xeon 6プロセッサー」などが含まれる。
Intelの主な発表内容
Gaudi 3
Gaudi 3は、AIの学習処理と推論を支援するIntelの最新AIアクセラレーターだ。Intelによると、24の200ギガビットイーサネット(GbE)ポートが統合されており、柔軟でオープンスタンダードなネットワークを提供する。前世代の「Gaudi 2」と比較してメモリ帯域幅は1.5倍、BF16の演算処理能力は4倍になるという。
Gaudi 3ソフトウェアは、PyTorchフレームワークを統合し、生成AI開発者にとって最も一般的なHugging Faceコミュニティが提供するAIモデルに最適化する。これにより、生成AI開発者はハードウェアやソフトウェアの互換性を気にすることなく、モデルの開発、移植が容易になるという。
Intelは、2024年第2四半期に、Dell Technologies、Hewlett Packard Enterprise、Lenovo、Supermicroをはじめとするメーカー各社にGaudi 3を提供開始予定としている。
Xeon 6プロセッサー
データセンター向けXeon 6プロセッサーは、組織のデータを活用するためのRAG(検索拡張生成)など、生成AIソリューションを実行するパフォーマンスと効率性を兼ね備えた製品だ。Xeon 6プロセッサーには、特定のユースケースに最適化された「E-cores」および「P-cores」の2種類のコアが用意されている。
E-cores搭載のXeon 6プロセッサー(開発コード:Sierra Forest)は、旧世代のプロセッサと比較して、ワット当たりのパフォーマンスを2.4倍に、ラック密度を2.7倍に向上。高い電力効率を実現し、サステナビリティ目標の達成を支援するという。
P-cores搭載のXeon 6プロセッサー(開発コード名:Granite Rapids)は、新たなデータフォーマット「MXFP4」に対応。第4世代Xeonプロセッサと比較して次のトークンを受け取るまでの時間を最大6.5分の1に低減し、大規模なAIモデルの性能向上を実現しているという。
Intelは2024年第1四半期中にXeon 6プロセッサーーを提供開始予定としている。
Intel Core Ultraプロセッサ
Intel Core Ultraプロセッサは、高性能なAI処理能力を提供することに特化した最新のクライアント向けプロセッサだ。1秒当たり100兆回超の処理性能(100TOPS)を有し、45TOPSを上回るNPU(ニューラルプロセシングユニット)を搭載する。ディープラーニングや機械学習タスクの高速化を実現しているという。
Ultra Ethernet Consortiumとの連携
Intelは、Ultra Ethernet Consortium(UEC)と提携し、AIに最適化されたさまざまなイーサネットソリューションを発表した。この発表には、AI対応NIC(ネットワークインタフェースカード)、AI接続チップレットの「XPU」への統合、Gaudiプラットフォームベースのシステムなどが含まれる。
Tiberポートフォリオ
Tiberポートフォリオは、企業環境におけるソフトウェアやサービスの導入を効率化するビジネス向けソリューションだ。生成AIアプリケーションを含む幅広いビジネスアプリケーションに適用できるという。Intelは、2024年第3四半期にTiberポートフォリオの一般提供開始を予定している。
エンタープライズAIのオープンプラットフォーム開発を推進するエコシステムの確立
Intelは、Red Hat、SAP、VMwareなどと連携し、エンタープライズAI向けオープンプラットフォームを共同開発する意向を示している。このエコシステムが目指すのは、RAG技術を用いたオープンかつマルチベンダー対応の生成AIシステムの開発だ。Intelはこの取り組みの初期段階として、XeonおよびGaudiベースのソリューションを使用した生成AIパイプライン用レファレンスやフレームワークを公開している。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- エッジAIに対応するRISC-Vの開発が進む? 2030年までに1億2900万個を出荷 ABI Research
調査会社ABI Researchは、RISC-Vの市場動向分析レポートを公開した。エッジAIワークロードの増加に伴い、2030年までにRISC-Vの出荷個数が1億2900万個に達すると予測している。 - 第287回 金価格の高騰が半導体業界を直撃? そこで登場する意外な日本企業
有名企業の中には、一見、本業が半導体とは無関係ながら、本体や子会社で半導体関連事業を手掛けているところがある。半導体産業は、裾野が広いので、いろいろなところで有名企業(や子会社)の名前が出てくる。今回は、ちょっとニッチなワイヤボンディングに関わる会社を見ていこう。 - オープンソースのLLMをローカルで実行できる「Ollama」Windowsプレビュー版、公開
Ollama Projectは、オープンソースの大規模言語モデルをローカル環境で実行できる「Ollama」のWindowsプレビュー版を公開した。