第231回 Intelの新プロセッサ「第10世代Coreプロセッサ」3つの特徴をざっくり検証:頭脳放談
Intelが、10nmプロセスで製造する第10世代のCoreプロセッサ群を発表した。第9世代に対して、幾つかの機能拡張が行われている。新しいCoreプロセッサの特徴を分析してみた。
2019年8月頭に、Intelが第10世代と称するIntel Coreプロセッサ製品群を発表した(Intelのプレスリリース「インテル、次世代のノートPC体験を提供する、最初の第10世代インテルCoreプロセッサーを発表」)。頭脳放談「第230回 AMD Ryzenが高コストパフォーマンスを実現した3つの理由」で取り上げたように、AMDの攻勢にさらされているIntelの反撃の第一弾と評価したいところだが少々違う。
10nmプロセスの量産開始で供給問題も解消か?
ターゲット市場がモバイルPC向けであり、AMDが挑んできた主力PCでのコスパ勝負とは、ちょっとズレたところに一石を置いたという感じだ。それでもIntelにとって大きな一歩であるのは、長らく待たれた10nmプロセスを使った本格量産製品であることだ(頭脳放談「第225回 なぜ『IntelのCPU不足』はなかなか解決されないのか?」参照)。Intelにしたら、新規プロセスはまずコンシューマー向けのモバイル製品で量産してみるという既定路線に沿った発表でもある。
以前からアナウンスされていたし、年末商戦に向けた本格出荷開始の公式発表であり、驚きはない(インテルのプレスリリース「COMPUTEX 2019において新しい第10世代インテル Coreプロセッサー搭載PCやProject Athenaを発表し、業界をリードする最も統合化されたプラットフォームを紹介」)。逆に発表がなかった、あるいは出荷が遅れた、となっていたら「驚き」をもたらすような類いの「あって当然」の発表である。
懸案だった供給能力の拡充と言う点では峠を1つ越えた感じだ。ようやく巨額の資金を飲み込み続けてきたはずの10nmラインが売り上げに寄与することとなり、ほっとしている関係者も多いのではないだろうか。
しかし、TSMCの7nmプロセスを使っているAMDをプロセス性能で圧倒できるほどのプロセスではないと思う。ただし、単純に7nmと10nmだから、7nmが優れているということもない。集積度を決める大きな要素であるメタルピッチなどでは、Intelの10nmプロセスはかなり過激でアドバンテージがあるようだ。
多分、モバイル向けコンシューマー製品を14nmから10nmに追い出して、空いた14nmのキャパをサーバ機向け製品などに向けるのだと想像する。
新Coreプロセッサの3つの特徴
新プロセッサの販促という面では、製造プロセスは売りにならない。何か機能面でユーザーにアピールしそうな、あるいは、株式市場のアナリストが食いつきそうなメリットを打ち出したいところである。それでかどうかは知らないが、Intelが持ち出してきたのは、市場関係(といってもPC市場というより資本市場がチラつく)で響きが良さそうな「AI(人工知能)」である。
最近、エッジデバイスでのAIが盛り上がっているし、モバイル向けプロセッサでAIをやるのは悪くない。ただ、ノートPCでどれだけのメリットがあるのかはちょっと想像がつかない。Intelの言い方としては、「薄型・軽量なノートPCおよび2 in 1 PC向けとして」初めてのAI利用を念頭に設計されたプロセッサである。「」内の限定がある分、メリットを享受できるユーザーもアプリも限られてしまう。
ともあれその特徴は3点ある。「Intel Deep Learning Boost命令セット」「最大1TFLOPSのGPU」「Intel Gaussian & Neural Accelerator(GNA)」である。どれもすでにアナウンスされている技術である。順番に見て行こう。
AI向け命令セットは当然の流れ?
まず、1つ目の「Intel Deep Learning Boost命令セット」である。
勝手な意見だが、身も蓋もない言い方をすると、512bit幅のAVX命令(SIMD拡張命令セット)に最近のニューラルネットワークで一般化した狭い8bit幅でのコンボリューション演算(畳み込み演算)のサポートを入れたもののだ。512bit幅のAVXは、サーバ機やHPC向けの機種では搭載しているものが以前からあった。今回のような軽量機種ではサポートがあっても256bit幅ではなかったか。SIMD命令なので、幅が広ければ広いほど並列度は高まる。256bitを512bitに2倍にすれば、単純計算性能は2倍になる。
一方、それとは別次元の話なのだが、ニューラルネットワークにおいてはデータ幅をより狭くするのがトレンドになっている。ニューラルネットワークはもともと倍精度浮動小数点数が不要で、単精度32bitを中心として開発が進んでいた。近年、単精度も不要、半精度16bitでも十分ということになり、さらに8bit整数でも、いやもっと狭いbit数だ、という流れになっている。
狭すぎても処理は面倒なので、8bit中心の処理というのはバランスもよい。単精度浮動小数点数であれば、512bit幅なら16並列だが、8bit幅なら64並列となる。全体幅が256から512と2倍で、その幅に4倍の要素が詰め込めるのであれば、8倍という単純計算である(実際には積和していくと幅が戻るのでそう単純ではないが)。ある意味やるべきことをやった、というだけだ。
Intelだけじゃない、NVIDIAやGoogle、Armなどもみんなやっている。ただ、ノートPCや2 in 1 PC向けにやったのが初めてだった、というだけだ。間違ったことは言っていないが、正直、アナリスト向けに盛っているのではないかと思う。
それに少々疑問も残る。確か512bit幅のAVX命令を持つサーバ機向け機種の一部だったと思うが、512bit AVXをぶん回すと通常より動作クロックが下がってしまうという仕様のものがあった。たぶん発熱の問題だろう。そんな幅広の演算器をぶん回したら電気を食うに決まっているのだ。ご承知の通り、AIでのコンボリューション演算の負荷は重い上に、飲み込むデータも大量で時間がかかるものが多い。熱的に厳しいモバイルでそんな演算をやり続けるようなアプリを動かすの? という疑問である。
それに比べると地味だが、不気味なのが後の2つだ。
今度のGPUは意外とイケる?
まず「最大1TFLOPSのGPU」の方だ。IntelのオンチップGPUは、ずっと評判が芳しくないが、地味に進化は遂げている。資料を見るに、今回のGen11と呼ばれるグラフィックスアーキテクチャはかなりよくなっているようだ。
あくまでグラフィックス関係機能中心の高速化がメインに読めるが、GPGPU的な使用方法に向かないわけでもなさそうだ。相当前のことになるが、試しにC++AMP(Microsoftを中心に開発している、GPUを活用した並列プログラミングのC++言語拡張)を使って、IntelのオンチップGPUで並列処理を動かしてみたが、残念な性能だったと記憶している。このときは、わざわざCPUの仕事を回す動機に乏しいと感じた。
しかし、今回は「そこそこ使えるのではないか」というように読める。ただ前述の512bit幅のSIMD命令も使える。単純な汎用計算であれば、直にCPU側で済ませる方が、座りのよいように思える。
何かCPUで処理するのとは別な仕事をGPUにオフロードしたい、といったケースであればGPUにお願いするのもありかと思う。それに何気にIntelもGPU推しに転換してきているようだ。今回から導入の新製品型番にそれが現れている。
いままでオンチップGPUは、型番の前面に出ていなかったのを、わざわざ最後のフィールドをGPUに割り当て、どのようなGPUが搭載されているのか容易に分かるようにしている。例えば「Intel Core i7-1065G7」の「G7」がGPUのレベルを表している(詳細はIntelの「インテルのプロセッサー・ナンバーとは」参照)。今後は、「オンチップGPUにも力を入れるぞ!」という意図が見え隠れしている。
GNAは音声操作などに向いた機能?
「Intel Gaussian & Neural Accelerator(GNA)」は、最も見えにくいが、3つの中では最もユニークそうだ。これもAIのアクセラレータだが、CPUとは異なるハードウェアである。とはいえ、全くCPUと独立ではなく、主記憶空間の一部を共有して動くようだ。これもCPU負荷をオフロードする仕組みといえる。
しかし、こちらは大きな電流が必要であろう負荷の重い仕事ではなく、だらだらと低消費電力で長時間続けなければならない仕事を担当する。音声処理とかノイズ抑制とかに対する処理を想定しているようだ。それこそメインのCPUがお休みしている時(当然、電池寿命のためにはCPUを小刻みに止める方がよい)もリアルタイムな音声処理は待ってはくれない、GNAが動き続けることで、音声を使った操作などが滞りなく行えるのはインタラクティブな用途では利点だろう。
さて、あまり小姑(こじゅうと)じみたことは書きたくないが、今回の日本語プレスリリースの品質はイマイチだと思う。英文のリリース資料の抄訳とは断ってあるが、ちょっと読んだだけでも「動画のスタイル化化」や「バッテリー寿命の最大化する専用エンジンとなる」など読んでいて日本語のおかしなところが幾つかある(自分も他人の文章を批判できるようなものではないが)。しかし、プレスリリースを公開する場合、普通、どこの企業も複数の人で事前チェックするものだと思う。それともAIの自動翻訳そのままなのか? それならそれで立派な会社方針だが。
筆者紹介
Massa POP Izumida
日本では数少ないx86プロセッサのアーキテクト。某米国半導体メーカーで8bitと16bitの、日本のベンチャー企業でx86互換プロセッサの設計に従事する。その後、出版社の半導体事業部などを経て、現在は某半導体メーカーでヘテロジニアス マルチコアプロセッサを中心とした開発を行っている。
「頭脳放談」
Copyright© Digital Advantage Corp. All Rights Reserved.