Hewlett Packard Enterpriseが開発を進めている「The Machine」は、メモリをアーキテクチャの中心に据えている。理論上は1.35PBの共有メモリに対し、40960のCPUコアからアクセスできる。このスケーラビリティが新たなアプリケーションにつながる可能性がある。
英国のIT専門媒体、「The Register」とも提携し、エンタープライズITのグローバルトレンドを先取りしている「The Next Platform」から、@IT編集部が独自の視点で“読むべき記事”をピックアップ。プラットフォーム3へのシフトが急速に進む今、IT担当者は何を見据え、何を考えるべきか、バリエーション豊かな記事を通じて、目指すべきゴールを考えるための指標を提供していきます。
「The Machine」の実力については、さまざまなことが言われてきた。Hewlett Packard Enterprise(HPE)が開発を進めているこのシステムは、新しいシリコンフォトニクスのインターコネクトやスケーラブルな大規模メモリプールにより、既に多くの大型NUMAサーバより大量のメインメモリに対する多数のコンピュートエレメントからの同時アドレスを実現している。2017年5月に発表された最新のプロトタイプでは、160TBものDDR4メモリがアドレス可能になっていた。
これは目覚ましい快挙だが、HPEはこのプラットフォームのメモリアドレッシング機能をさらに大きく拡張できる。そのため、標準的なDRAMメモリと低コストメモリの両方が利用可能だ。低コストメモリにはIntelとMicron Technologyの「3D XPoint」や、HPE自身のメモリスタなどが含まれる。ただし、メモリスタは製品化が先決となる(メモリスタは長期にわたり継続的に使われていくHPEの未来の技術のように見えるが、2018年に3D XPointがIntelからDIMMのフォームファクタでの提供が計画通りに開始されたら、未来の技術のままになってしまうかもしれない)。
The Machineはエクサスケールまで拡張できる。このことが理由の1つとなり、最近、HPEに米国エネルギー省が進める「Exascale Computing Project」の研究開発資金の一部が与えられた。
The Machineの可能性を理解するため、われわれはHewlett Packard Labsのチーフアーキテクトを務めるカーク・ブレスニカー氏とチャットを行った。Hewlett Packard LabsはHPEの研究開発部門だ。同氏は、The Machineのメモリ空間を巨大な規模に拡張できる仕組みや、このおかげでThe Machineが多くのエクサスケールジョブに適していることを詳しく説明してくれた。
だが、その内容を紹介する前に、HPEが最新プロトタイプのThe Machineで達成した成果を見てみよう。
The Machineの基本的な前提はコンピュートではなく、メモリをアーキテクチャの中心に据えることと、非常に高速なシリコンフォトニクスを使用し、メモリとしてアドレス可能な膨大な永続ストレージを束ねて単一のアドレス空間を形成し、このメインメモリに多数のコンピュートエレメントを接続することだ。コンピュートエレメントは、消費者向けのデバイスやアプライアンスの一部では、一般的なSoC(システムオンチップ)パッケージとなる。
2015年に、われわれはThe Machineのアーキテクチャを掘り下げ、従来のHPC(ハイパフォーマンスコンピューティング)のシミュレーションやモデリングのワークロードとどのように関連するかを分析した。さらに、2016年秋にHPEが発表した大き過ぎない規模のDRAMベースのプロトタイプについても詳しい解説を加えた。
HPEがWestern Digitalと開発しているメモリスタのリリースが遅れており、Intelも3D XPointのDIMMスティック「Apache Pass」(コードネーム)の出荷が遅れていることから、HPEとしてはThe MachineのプロトタイプはDRAMを使って作らざるを得ない。なお、Apache Passは「Xeonスケーラブルプロセッサー」(コードネーム:Skylake-SP)を採用するサーバプラットフォーム「Xeonスケーラブルプラットフォーム」(コードネーム:Purley)の主要コンポーネントになると考えられていた。
このように、The MachineのプロトタイプはDRAMを使用しているので、電源を切るとデータが失われる。だが、こうした永続メモリが市場に投入されれば、それは変わることになる。われわれは顧客が、非永続のDRAMと3D XPointやメモリスタのような永続メモリが組み合わされ、高速領域と低速領域があるメモリプールを求めるのではないかと見ている。
処理エレメントに関しては、初期のプロトタイプはCaviumのARMベースSoC「ThunderX」を使って作られていた。だが、The Machineの重要なポイントは、任意のコンピュートをメモリプールに接続できることにある。HPEと傘下のSGIのチームはx86コンピューティングに精通しており、プロトタイプでARMを選択したことはHPEの知識を広げるのに役立った。また、XeonやOpteronでは不可能な大容量メモリのアドレッシングを可能にした。
最新のプロトタイプは重要な意味を持つ。ラックスケール設計が施されアドレス可能なメモリが160TBとなり、1280個のコンピュートコアを使用しているので、実用的な作業をどれだけの効率で行えるかを実際にテストできるだけの規模があるからだ。
これらの要素はシリコンフォトニクスモジュール「X1」とファブリックブリッジで接続されている。X1は今のところ、TSMC(Taiwan Semiconductor Manufacturing Company)において16ナノメートル(nm)プロセスで実装されている。ファブリックブリッジは、カスタムASICにエッチングされるのではなく、FPGAに実装されている(FPGAの使用は、新しいコンピュートやネットワーキングチップの開発では一般的だ)。
Copyright © ITmedia, Inc. All Rights Reserved.