しかし、社内にあるデータがつながっても「学習データが足りない」という課題もあった。サイバーエージェントでは、AIモデル開発に必要な教師データを、クラウドソーシングを活用して収集している。毛利氏は、クラウドソーシングサービスを活用した理由について「効率性」「単価」を挙げて説明する。
「当初は社内で人を抱えて学習データの作成に取り組んでいたが、属人化した結果、『アノテーション作業を10万件やっといて』と頼んでも、他タスクが終わるまで順番待ちになり、AI開発が思うように進まないという課題があった。そこでクラウドソーシングサービスを活用することにした。『(人件費+システムの開発費用)÷どれぐらいのタスクをやったか』で1個当たりのタスク単価を計算した結果、テキストのアノテーションは社内で1タスク当たり2.8円、クラウドソーシングで3.0円とほとんど変わらなかったが、画像のアノテーションの場合、社内で1タスク当たり40円かかっていたのが、クラウドソーシングサービス活用で5.0円になるなど、8分の1までコストを抑えられた。そしてコストが抑えられた分、作業を複数人に依頼できたので、属人性を排除した客観的なアノテーションを基に学習データを作成できた」
サイバーエージェントはクラウドソーシングサービスの作業者に内製したアノテーション専用ツールを提供した。このツールにはテキストや画像、動画のアノテーションを自発的に早めさせる工夫を取り入れているという。
「アノテーションには制限時間がないため、作業者によってタスクを終えるのに時間がかかる。そこで、右から左に消えていくバーを配置して、時間を意識して作業を進めさせる工夫を入れた」
講演では、広告に利用する素材の一つ「人物画像」を自動生成するAIモデルの研究開発に取り組んでいることも紹介した。このプロジェクトでは、実在しない日本人の顔画像を自動で生成することで、広告制作に必要な作業を削減しようとしているという。
「人物画像を利用した広告を制作する場合、広告出演者と、広告に表示される文字や構図などを事前に相談したり、撮影場所や機材の確保、出演者との契約を確認したりと、何かと時間がかかる。そこで、広告に必要な顔画像を自動生成して制作工数を削減したいと考えている」
開発に至っては、米国で登場したGAN(Generative Adversarial Networks:敵対的生成ネットワーク)を用いた人物画像を自動生成する研究に着目。日本人の顔で広告に利用できるレベルの人物画像を生成できるかどうかの研究開発に取り組んだ。しかし、「日本人の顔をうまく生成できなかった」と毛利氏は振り返る。
「海外で公開されているGANのモデルを利用して試作したが、日本人の顔を自動生成することはできなかった。とくに再現できていなかったのは、日本人の髪形だ。そこで、日本人の特徴を捉えた人物画像を生成するため、さまざまな人に協力してもらい学習データを集めることにした」
広告出演者などに声を掛け、正面や前髪アップなどの人物画像を3000枚収集。現在、実用化に向けて社内で研究開発を継続している。今後は、制作した広告のレビュー、入稿ができるWebサービスの活用や、先述した人物画像自動生成AIモデルの開発を進め、「効果の高い広告」を素材レベルから自動生成するための取り組みを続けていくという。毛利氏は今後の展望を述べて、講演を締めくくった。
「今までは顧客と広告について相談する際、クラウドストレージに広告データを置き、メールで広告内容について相談していた。これをシステム化することで、顧客と広告入稿担当者はより効率的なコミュニケーションが可能となる。他方で、AI研究者やエンジニアにとっては、生成した広告が顧客に承認されるまでどのくらい時間がかかったか、広告のどの部分に顧客からどのような指摘が入ったのか、というデータが手に入る。今後、これらのデータを生かしたAIモデルの研究開発にも取り組んでいきたい」
Copyright © ITmedia, Inc. All Rights Reserved.