ディープラーニングの演算量を80%削減 NEDOとOKIが軽量化技術を開発:車載用途やIoT機器などでも高度なAIを活用
NEDOとOKIは、ディープラーニングのモデルを軽量化する新技術を開発した。OKI独自のチャネルプルーニング技術を発展させた。既存の高精度モデルに対して、認識精度の劣化を約1%に抑えつつ、演算量を約80%削減した。
国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)と沖電気工業(OKI)は2019年9月9日、多様な分岐や合流のあるネットワーク構造を含むディープラーニングのモデルを軽量化する新技術を開発したと発表した。認識性能を維持しつつ、メモリの使用量や消費電力を低減できるという。エッジデバイスやIoT(モノのインターネット)機器など、演算性能や電力消費に制限がある機器にも高度なAI(人工知能)を実装できるようになる。
ディープラーニングは、脳内の神経細胞ネットワークの構造を模したモデルで構成するAIアルゴリズムで、画像や音声などの認識性能に優れる。中間層(隠れ層)を多層化することで認識性能をより高められる。しかし、中間層を多層化すると演算量が増え、演算性能やメモリといった演算リソースを多く必要とし、消費電力も高くなる。そのため、車載用途や組み込み機器、IoT機器など演算リソースが制限されている機器で高度な認識性能を備えたディープラーニングモデルを実行させるには、モデルの軽量化技術の開発が課題となっていた。
NEDOとOKIが開発した技術は、OKI独自のチャネルプルーニング技術である「PCAS」(Pruning Channels with Attention Statics)を発展させたもの。チャネルプルーニングとは、畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)と呼ばれるディープラーニングのアルゴリズムの1つに対して、モデルの畳み込み層から冗長なチャネルを削減し、チャネルに関連する演算量を減らす技術。従来のチャネルプルーニングは、層ごとに削減率を設定する必要があって手間がかかる上に、全体として最適な削減にならないという欠点があった。
今回開発されたモデル軽量化技術の特徴
これに対してPCASは、ディープラーニングの中間層の層と層の間にアテンションモジュールを導入してチャネルの重要度を推定するようにした。これによって、認識性能を維持しつつ、層単位の削減率設定を不要とした。
アテンションモジュールは、後段の層への情報伝達を抑制する役割を担う。モデル全体の推論誤差を最小化するよう学習させることで、全体を最適化させた重要度推定を可能にした。ディープラーニングのモデル構造が多様化しており、今回開発した技術では、こうしたモデル構造の多様性を考慮した。重要なチャネルを自動選択することで、認識性能を維持しつつ、演算量を大幅に削減できたという。
NEDOとOKIが実施した測定では、既存のベンチマークとされる高精度モデルに対して、認識精度の劣化を約1%に抑えつつ、演算量を約80%削減できたとしている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 「半分の学習データ量」で高い識別精度を維持するディープラーニング技術を開発 NEC
NECは、学習データ量が従来の半分程度でも高い識別精度を維持できるディープラーニング技術を開発した。ニューラルネットワークの中間層で得られる特徴量を意図的に変化させることで、識別に失敗しやすいデータを集中的に人工生成して識別精度を高める。 - ディープラーニングも使える確率的プログラミングツール「Gen」を開発、MIT
マサチューセッツ工科大学(MIT)の研究チームが開発した確率的プログラミングツール「Gen」を使えば、初心者でも簡単にAIに触れることができ、専門家は高度なAIプログラミングが可能になる。ディープラーニングよりも適用範囲の広いことが特徴だ。 - Lesson 1 ディープラーニングを始めるための、プログラムの基礎
ディープラーニングはプログラムとして作成するが、そもそもプログラムとは何なのか? プログラムに関する基礎の基礎を紹介する。