NTTドコモとドコモgaccoは、AI技術を活用して大規模公開オンライン講座を制作した。講師が話している数分程度の動画の「口の動き」に、テキストから生成した音声データを重ね合わせることで講師本人が話しているような講義動画を自動生成したという。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
NTTドコモとドコモgaccoは2021年3月12日、AI(人工知能)技術を活用して大規模公開オンライン講座を制作したと発表した。ドコモgaccoが運営する「gacco」で受講できる。NTTドコモによると「AIを活用して制作した大規模公開オンライン講座の提供は日本で初めてだ」という。
公開された講座は「AIの基礎と開発プロジェクトの進め方」。この講座はNTTテクノクロスの音声合成サービス「FutureVoice Crayon」と、データグリッドの人物動画生成技術を活用して制作された。
FutureVoice Crayonは、テキストデータから人間の声と遜色ない自然な音声データを生成するサービス。人物動画生成技術は、数分間の動画から「長時間、講師が話している動画」を作り、音声データに合わせて口を動かすことができる。FutureVoice Crayonで生成した音声データを、人物動画生成技術で作った動画に重ね合わせることで、講師本人が話しているような講義動画を制作できるという。
NTTドコモは「こうした音声合成技術と人物動画生成技術を活用することで、講師がスタジオに出向いたり、講義原稿を解説したりすることなく、講義動画を制作できる」としている。
Copyright © ITmedia, Inc. All Rights Reserved.