用語「次元削減」について説明。情報量を本来よりも減らすことで、本質的なデータ構造(特徴:features)を表現することを指す。
次元削減(Dimensionality Reduction)とは、情報量を本来よりも減らすことで、本質的なデータ構造(特徴:features)を表現することである。データの圧縮やデータの可視化(画像のノイズ除去など)で使われる。
例えば教師なし学習のオートエンコーダーで画像データを学習した場合、隠れ層(中間層)のノードを減らすことで、画像の純粋な特徴、つまり画像の中に描かれているエッジや角、線といった本質的な特徴のみを抽出できる(図1)。出力層で、そこから復元することによって、元の画像にある揺らぎなどが抑えられ、純粋な特徴だけが表現された画像が取得できる。
Copyright© Digital Advantage Corp. All Rights Reserved.