IBM、メインフレームでLLM/生成AIワークロードを加速するプロセッサ「Telum II」、アクセラレータ「Spyre」などを発表AIプロジェクトのPoC止まりを防ぐには?

IBMは、メインフレームシステム「IBM Z」の次世代製品などに搭載される「IBM Telum II」プロセッサ、同プロセッサ上のI/Oアクセラレーションユニット、同プロセッサを補完する「IBM Spyre」アクセラレータのアーキテクチャの詳細を発表した。

» 2024年08月29日 08時00分 公開
[@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 IBMは2024年8月26日(米国時間)に国際カンファレンス「Hot Chips 2024」で、メインフレームシステム「IBM Z」の次世代製品などに搭載される「IBM Telum II」プロセッサ、同プロセッサ上のI/Oアクセラレーションユニット、同プロセッサを補完する「IBM Spyre」アクセラレータのアーキテクチャの詳細を発表した。

 これらの新技術は、次世代メインフレームシステムの処理能力を大幅に向上させるように設計されており、AI(人工知能)の新しいアンサンブル手法(複数の機械学習〈ML〉やディープラーニングAIモデルをエンコーダー大規模言語モデル〈LLM〉と組み合わせる手法)を通じて、従来のAIモデルとLLMの併用を加速させるのに役立つ。

LLM/生成AIプロジェクトのPoC止まりを防ぐために優先すべきこととは?

 IBMは、「LLMを活用する多くの生成AIプロジェクトが概念実証(PoC)から実運用に移行する中、企業では、電力効率に優れ、安全でスケーラブルなソリューションの確保が重要な優先事項となっている」との認識を示し、「IBM Telum IIプロセッサとIBM Spyreアクセラレータは、LLMや生成AIなど、エンタープライズスケールのAI機能を実現する。また、新しい高度なI/Oアクセラレーションユニットは、電力消費の削減とデータセンターの省スペース化を可能にするスケーラブルなI/Oサブシステムを実現し、簡素化する」と新技術をアピールしている。

製品群とアンサンブル手法の詳細

IBM Telum IIプロセッサ

 次世代IBM Zシステム向けに設計されたTelum IIプロセッサは、第1世代のTelumプロセッサと比べて周波数とメモリ容量が向上し、オンチップキャッシュ容量が40%増加しており、統合されたAIアクセラレータコア、コヒーレントに接続されたデータ処理ユニット(DPU)を備えている。LLMのエンタープライズ向けコンピュートソリューションをサポートし、業界の複雑なトランザクションニーズに対応することが期待されている。

I/Oアクセラレーションユニット

 Telum IIプロセッサに統合されている新しいDPU。メインフレーム上のネットワーキングとストレージ用の複雑なI/Oプロトコルを高速化するように設計されている。システム運用を簡素化し、主要コンポーネントのパフォーマンスを向上させる。

IBM Spyreアクセラレータ

 Telum IIプロセッサを補完するAIコンピュート機能を提供するアドオンオプションのPCIeカード。Telum IIとSpyreを組み合わせて使用することで、AIモデリングのアンサンブル手法をサポートするスケーラブルなアーキテクチャが形成される。アンサンブルAIは、使用する個々のモデルアーキテクチャの強みを生かし、個々のモデルより正確で堅牢(けんろう)な結果を提供できる。

アンサンブル手法

 Telum IIプロセッサとSpyreアクセラレータは、IBMの長年の製造パートナーであるSamsung Foundryによって製造され、高性能で電力効率の高い5ナノメートルプロセスノード上に構築される。Telum IIプロセッサとSpyreアクセラレータを組み合わせることで、AIのアンサンブル手法により、顧客はより迅速に、正確な予測結果を得ることができる。そうした恩恵を受けられる生成AIアプリケーションの例として、保険金請求の不正検出、高度なマネーロンダリング(資金洗浄)対策、AIコーディング支援などがある。

仕様と性能指標

IBM Telum IIプロセッサ

 5.5GHzで動作する8つの高性能コアを搭載する。コア当たり36MBのL2キャッシュを備え、オンチップキャッシュ容量は前世代より40%増加し、仮想L3キャッシュが360MB、仮想L4キャッシュが2.88GBとなっている。統合されたAIアクセラレータは、低レイテンシ、高スループットのイントランザクションAI推論を可能にする。チップ当たりのコンピュート能力を前世代の4倍に向上させる。

I/OアクセラレーションユニットDPU

 I/O密度を50%向上させ、データ処理を改善するよう設計されている。この進化により、IBM Zの全体的な効率性とスケーラビリティが向上する。

IBM Spyreアクセラレータ

 複雑なAIモデルや生成AIのユースケース向けにスケーラブルな機能を提供する。最大1TBのメモリを搭載し、通常のI/Oドロワーの8枚のカードが連携して動作するように設計されている。カード1枚当たりの消費電力が75ワット以下でありながら、メインフレーム全体のAIモデルのワークロードをサポートする。各チップは、低レイテンシの高スループットAIアプリケーション向けに、int4、int8、fp8、fp16データ型をサポートする32個のコンピュートコアを搭載する。

提供時期

 IBM Telum IIプロセッサは、次世代IBM Zおよび「IBM LinuxONE」プラットフォームの中心的なプロセッサとなる。2025年にTelum II搭載のこれらの製品がリリースされる見込みだ。2024年8月現在、技術プレビュー段階にあるIBM Spyreアクセラレータも、2025年に提供が開始される見込みだ。

Copyright © ITmedia, Inc. All Rights Reserved.

スポンサーからのお知らせPR

注目のテーマ

Microsoft & Windows最前線2025
AI for エンジニアリング
ローコード/ノーコード セントラル by @IT - ITエンジニアがビジネスの中心で活躍する組織へ
Cloud Native Central by @IT - スケーラブルな能力を組織に
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。