OpenAI、動画生成AI「Sora」を発表 技術レポートで明かされる開発ビジョン、学習の仕組み、課題とは:「物理世界の汎用(はんよう)シミュレーター構築に向けた有望なステップ」
OpenAIは、テキストから最大60秒の動画を生成するAIモデル「Sora」を発表した。
OpenAIは2024年2月15日(米国時間)、テキストから最大60秒の動画を生成するAI(人工知能)モデル「Sora」を発表した。
Soraは、複数のキャラクターや特定の種類の動き、細部まで正確に表現された被写体、背景がある複雑なシーンを生成できる。ユーザーがプロンプト(指示)で要求したものだけでなく、それらが物理世界にどのように存在するかも理解しているとしている。
SoraのWebページでは、Soraによって生成された非常にリアルなさまざまな動画がそれぞれのテキストプロンプトとともに公開されている。
OpenAIは現在、Soraをレッドチーマー(誤った情報、憎悪に満ちたコンテンツ、偏見などの分野の専門家)に、危険やリスクの評価用に提供している。また、多くのビジュアルアーティスト、デザイナー、映画製作者にもアクセスを許可している。クリエイティブの専門家に最も役立つSoraの改良方法について、フィードバックを得たい考えだ。
OpenAIは、こうしたフィードバックを踏まえるとともに、レッドチーマーとの協力によるテストを経て、重要な安全対策を講じた上で、SoraをOpenAI製品で利用できるようにする計画だ。
また、SoraをOpenAI製品に展開する場合は、Soraによって生成された動画にC2PA(Coalition for Content Provenance and Authenticity)メタデータを含ませることで、Soraによって生成されたことが識別できるようにするとしている。
Soraの開発ビジョン
OpenAIは、現実世界との相互作用を必要とする問題の解決に役立つモデルをトレーニングすることを目標に、動く物理世界を理解し、シミュレートするようにAIを教育している。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- Stability AI、動画生成AI「Stable Video Diffusion」のAPIを公開
Stability AIは、同社が提供するDeveloper Platformで「Stable Video Diffusion」のAPIを公開した。 - Microsoft Copilotの基本的な設定と使い方
Windows OSには、「Microsoft Copilot」や「Copilot in Windows」といった無料で利用可能な生成AI機能が実装されている。これらを活用することで仕事の効率化を図ることができる。本稿では、活用する前段階として、Microsoft Copilotを使う方法や設定などについて紹介しておこう。 - 2024年の「AI/機械学習/データ分析」はこうなる! 7大予測
昨年2023年は、ChatGPTやGoogle BardなどのチャットAIに注目が集まり、企業やサービスに生成AIが導入されていくなど、大きな変化が一気に起こりました。今年2024年の「AI/機械学習/データ分析/データサイエンス」かいわいはどう変わっていくのか? 現状を踏まえつつ、未来を予測します。