ルール大学の研究チームが、ディープラーニング技術を用いて生成されたフェイク画像を識別する方法を開発した。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
ルール大学ボーフムのホルストゲルツITセキュリティ研究所とクラスタオブエクセレンスCASA(Cyber Security in the Age of Large-Scale Adversaries)の研究チームが、ディープフェイク画像を効率的に特定する新しい方法を開発した。
ディープフェイク画像とは、ディープラーニング技術を用いて生成され、人間には本物の写真とほとんど見分けがつかないフェイク(偽)画像を指す。研究チームはこうした画像を効率的に特定する方法の開発を目的に、画像を周波数領域に変換して分析した。これは確立された信号処理手法だ。
研究チームは2020年7月15日(現地時間)、International Conference on Machine Learning(ICML)でこの研究成果を発表した。実験結果を再現できるように、実験のために作成したコードをGitHubで公開している。
ディープフェイク画像は、敵対的生成ネットワーク(GAN)というコンピュータモデルを使って生成する。このネットワークは、2つのアルゴリズムが連携して動作する。一方のアルゴリズムは、特定の入力データを基にランダムな画像を生成する。もう一方のアルゴリズムは、その画像がフェイクかどうかを判定する。画像がフェイクだと分かると、後者のアルゴリズムは前者のアルゴリズムに画像を修正するよう命令する。この判定と命令の発行は、後者のアルゴリズムが画像をフェイクと認識しなくなるまで繰り返される。
近年ではこの手法を用いて、極めて精度の高いディープフェイク画像が作られるようになっている。研究チームは、ディープフェイク画像を分析するため本物とフェイクの写真を見分けられるかチェックできるWebサイト「Which Face Is Real」のベースになったデータセットを使用した。
従来、ディープフェイク画像を見破るために複雑な統計手法を用いた分析が進められてきた。だが、研究チームは「離散コサイン変換(DCT)」を用いて画像を周波数領域に変換するアプローチを選択した。こうして生成された画像は、多数のさまざまなコサイン関数の和として表現される。
分析の結果、GANで生成された画像は、高周波数領域で典型的なアーティファクト(データや信号の誤り)が見られることが分かった。例えば、フェイク画像の周波数表現では、典型的な格子構造が現れる。
研究者は実験結果を次のように説明している。「われわれの実験はアーティファクトがGANで生成された画像にのみ現れることを示した。これは機械学習アルゴリズムの構造的な問題だ。今回の研究成果を用いることで、ディープフェイク画像かどうかが常に分かると考えている。周波数領域へ変換するアプローチは、コンピュータによる生成画像を特定する効果的な方法だ」
Copyright © ITmedia, Inc. All Rights Reserved.