「半分の学習データ量」で高い識別精度を維持するディープラーニング技術を開発 NEC中間層で得られる特徴量を変化させる

NECは、学習データ量が従来の半分程度でも高い識別精度を維持できるディープラーニング技術を開発した。ニューラルネットワークの中間層で得られる特徴量を意図的に変化させることで、識別に失敗しやすいデータを集中的に人工生成して識別精度を高める。

» 2019年08月20日 08時00分 公開
[@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 NECは2019年8月19日、学習データ量が従来の半分程度でも高い識別精度を維持できるディープラーニング技術を開発したと発表した。ディープラーニングを適用するシステムの開発期間を短縮できるとしている。

中間層の特徴量を意図的に変える

 ディープラーニングは、入力層、中間層(隠れ層)、出力層という、大きく分けて3層構造を採る。そのうち中間層では、人工ニューロン(シグモイドニューロン)と呼ばれる脳の仕組みを模したモデルを複数組み合わせてニューラルネットワークを構成する。

 NECが開発した技術は、この中間層で得られる特徴量を意図的に変化させることで、識別に失敗しやすい「苦手な学習データ」を集中的に人工生成して識別精度を高める。NECは、同社が開発した技術を「MNIST」と呼ぶ手書き数字認識に適用したところ、学習データ量が半分でも従来の技術と認識精度が変わらないことを確認したとしている。

画像 数字認識のMNISTと物体認識のCIFARそれぞれで精度を測定(出典:NEC

「データ拡張」との違い

 一般にディープラーニングの識別精度を高めるには、「苦手な学習データ」をより多く学習させることが有効といわれている。従来は、ニューラルネットワークに入力する前にデータを意図的に加工、変形させて、学習データ量を人工的に増やす「データ拡張」と呼ばれる方法で、苦手な学習データを取得していた。だがこの方法では、データ量が不十分で、識別精度の向上に寄与しないデータも多く生成されてしまい、結果として十分な学習効果が得られなかった。

画像 従来技術との違い(出典:NEC

 さらにデータ拡張は、データの種類に応じてデータの生成方法を変える必要があったため、専門家がデータ生成方法を慎重に選び、学習に悪影響を及ぼすデータが発生しないよう調整しなければならなかった。

 これに対してNECの技術は、データの種類を問わず汎用(はんよう)的に適用可能で、専門家による調整がいらない。ニューラルネットワーク内部の数値に基づいて自動的に学習データを生成するためだ。

Copyright © ITmedia, Inc. All Rights Reserved.

スポンサーからのお知らせPR

注目のテーマ

Microsoft & Windows最前線2025
AI for エンジニアリング
ローコード/ノーコード セントラル by @IT - ITエンジニアがビジネスの中心で活躍する組織へ
Cloud Native Central by @IT - スケーラブルな能力を組織に
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。