Google DeepMindは、AIが生成したテキストコンテンツを識別できる電子透かし技術「SynthID Text」をオープンソースで公開した。SynthIDは、さまざまなディープラーニングモデルとアルゴリズムを使用して、人間には知覚できない電子透かしをAI生成コンテンツに、元のコンテンツを損なうことなく直接埋め込む技術だ。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
GoogleのAI(人工知能)研究部門Google DeepMindは2024年10月23日(米国時間)、AI生成テキストを識別できる電子透かし技術「SynthID Text」をオープンソースで公開した。
SynthIDは、さまざまなディープラーニングモデルとアルゴリズムを使用して、人間には知覚できない電子透かしをAI生成コンテンツに、元のコンテンツを損なうことなく直接埋め込む技術だ。任意のコンテンツをスキャンし、電子透かしが埋め込まれている可能性をスコア化して、コンテンツやその一部がGoogleのAIツールで生成されたかどうかをユーザーが判断できるという。
Google DeepMindは「AIが生成したコンテンツを識別できるようにすることは、情報の信頼性を高める上で非常に重要であり、SynthIDは、このAIの安全性の問題に対する有望な技術ソリューションだ」と述べている。
SynthIDは、以下のようにGoogleのさまざまな製品に統合されつつある。
電子透かしはAI生成テキストを識別するのに役立つ一方、品質、検出性、計算効率の要件が厳しいことから、本番システムには採用されていない。AI生成テキストを識別する「SynthID Text」(SynthIDテキスト)は、テキスト品質を保持し、最小限のレイテンシで高い検出精度を実現する、本番システム対応のテキスト電子透かしだ。
Google DeepMindは2024年10月、SynthIDテキストに関する論文をNature誌で発表し、「Hugging Face」と「Google Responsible GenAI Toolkit」を通じてSynthIDテキストをオープンソースで公開した。Hugging Faceは、AIモデルの開発、トレーニング、デプロイ(展開)に広く使われているオープンソースプラットフォーム。Responsible GenAI Toolkitは、安全なAIアプリケーションを作成するためのツールキットだ。
SynthIDは、Google DeepMindが開発した音楽生成AIモデル「Lyria」で最初にデプロイされた。Lyriaを使用して公開された全てのAI生成オーディオは、その波形にSynthID透かしが直接埋め込まれている。
電子透かしは、ノイズの追加、MP3圧縮、トラックのスピードアップやスローダウンなど、多くの一般的な変更に強い。SynthIDは、オーディオトラックをスキャンして、さまざまなポイントにおける透かしの存在を検出し、その一部がLyriaで生成された可能性があるかどうかを判断するのに役立てられる。
SynthIDは、AIが生成した画像のピクセルに、あるいはAIが生成した動画の各フレームに、電子透かしを直接追加する。
画像や動画の品質を損なわないように設計されており、トリミング、フィルターの追加、色の変更、フレームレートの変更、さまざまな非可逆圧縮スキームでの保存といった変更後でも、透かしを検出可能な状態に保てる。
AIが生成した画像と動画用のSynthIDは、「Google Cloud」のフルマネージド統合AI開発プラットフォーム「Vertex AI」のAI画像生成ツールである「Imagen 3」や「Imagen 2」で利用できる。Imagen 3をブラウザから利用できる「ImageFX」や、Google DeepMindが開発した高性能動画生成モデル「Veo」にも統合されている。
AI生成画像、動画用のSynthIDでは、単一の画像や動画の個々のフレームをスキャンして電子透かしを検出できる。ユーザーは「Google検索」やGoogle Chromeの「この画像について」機能により、画像やその一部がGoogleのAIツールで生成されたかどうかを識別できる。
Copyright © ITmedia, Inc. All Rights Reserved.