AIで顔や広告を自動生成――サイバーエージェントは学習データをどのように集めたか?:“おいしいデータ”で、成果が出るAIモデルを育てる(3)(1/2 ページ)
「AIに広告を自動生成させる」――サイバーエージェントでインターネット広告事業本部の毛利真崇氏が、現在取り組んでいるAIモデル研究開発について語った。
広告事業を展開するサイバーエージェントは、「細分化が進むターゲティング対象に合わせて大量の広告を作成しなければならない」という課題に対し、バナー画像などの広告をAIで大量生成したり、広告に必要な人物画像を自動生成したりして乗り越えようとしている。
「“おいしいデータ”で、成果が出るAIモデルを育てる」第3回は、2019年3月に開催された「SIX 2019」において、サイバーエージェントでインターネット広告事業本部の毛利真崇氏が講演した内容を、要約してお伝えする。
AIモデル開発に利用したいデータが社内に散在
現在、さまざまなサービスで、ユーザーのプロフィールやニーズに合わせた広告を配信する「ターゲティング」が用いられている。検索履歴や位置情報、購買履歴などの個人データを用いたターゲティングの細分化も進んでいる。
「従来の広告は、全ユーザーに対して同じ広告を配信していた。しかし、ターゲティング手法の登場と細分化で、ターゲットに合わせて配信する広告を変えるのが当たり前になった。その結果、多くの広告を作成する必要が出てきた」
サイバーエージェントでは、広告作成に必要な画像収集システムを内製して3カ月間に約10万本の広告を作成している。それでも、広告の制作時間の不足に悩まされているという。
そこでサイバーエージェントのクリエイティブAI研究所では、今まで制作してきた広告を学習データにして、広告を自動生成するAIモデルの開発に取り組んでいる。しかし、開発には2つの課題があった。
1つ目は、広告を自動で生成するAIモデルを開発しようとしても、開発に必要なデータが社内に散在していたことだ。社内で働くクリエイターが「広告の素材」「広告の制作、編集データ」を持っていたり、コンサルタントや営業が「広告効果レポート」を持っていたり、1カ所にデータを集められていなかった。
2つ目は、広告の制作データが複雑なことだ。社内では広告を「Adobe Photoshop」を用いて制作し、PSD形式で保存している。PSD形式では文字や画像などのデータをレイヤーごとに管理する。そのため、PSDデータの中に、広告で使っていない編集途中のデータが含まれている場合がある。そのようなPSDデータを学習に利用すると、AIモデルが、編集途中の広告を生成する可能性があった。
そこで、AI開発のために必要なデータを集約して、学習できるデータに変換するためだけの専門部署「データクレンジンググループ」を発足。広告の素材と効果をひも付けるためのデータ基盤の開発や、不必要な制作データを削除したPSDデータと広告画像をひも付けてデータベースに格納する作業を行い、研究者やAIエンジニアがそれらのデータを活用して開発できる環境を整備したという。
「データクレンジンググループによるデータ集約作業の結果、広告素材と広告効果のデータがつながった。どのような広告素材を使ってどれくらいの広告効果があったのかということが分かるようになったので、今後、価値のある広告を自動生成できるAIモデルの開発が行えるだろう」
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 囲碁プロ棋士に勝ったAI「Alpha Go」で使われた、「強化学習」って何?
昨今、多くのサービスに使われ、注目を浴びる「機械学習」。しかし、機械学習にはさまざまな学習方法が存在する。今回は、学習方法を比較しつつ、「強化学習」の概要を紹介する。 - ニューラルネットワークライブラリTensorFlow/Kerasで実践するディープラーニング
最近流行の機械学習/Deep Learningを試してみたいという人のために、Pythonを使った機械学習について主要なライブラリ/ツールの使い方を中心に解説する連載。今回はニューラルネットワークのライブラリであるTensorFlow/Kerasについて解説します。 - AIのトレーニング時間を60%以上短縮する新手法を開発、米大学
ノースカロライナ州立大学の研究チームが、ディープラーニングネットワークのトレーニング時間を、精度を損なうことなく60%以上短縮する「Adaptive Deep Reuse」という手法を開発した。