OpenAI、画像生成AIの最新版「DALL-E 3」を発表：ユーザーのアイデアを正確な画像に簡単に変換

OpenAIは、画像生成AIの最新版「DALL-E 3」を発表した。テキストに忠実な画像を生成する能力が飛躍的に向上している。

[＠IT] PC用表示関連情報

LINE

Hatena

　OpenAIは2023年9月21日（米国時間）、自然言語で記述された文章から画像を生成するAI（人工知能）の最新版「DALL-E 3」を発表した。

　DALL-E 3は、従来のシステムよりもニュアンスやディテールを理解し、ユーザーのアイデアを忠実に再現する画像を生成する。9月21日の発表時点でリサーチプレビュー段階にあり、OpenAIが提供するChatGPTの有料プラン「ChatGPT Plus」と「ChatGPT Enterprise」のユーザーに、2023年10月からAPI経由で提供される予定だ。

画像生成能力が向上

　OpenAIは、「最近登場した画像生成AIは、入力された単語や説明を無視する傾向があり、ユーザーはプロンプトエンジニアリングを学ぶ必要があった。だが、DALL-E 3は、与えられたテキストに忠実な画像を生成する能力が飛躍的に向上している」と述べている。

　同じプロンプトでも、DALL-E 3が生成する画像は、DALL-E 2よりも大幅に改善されているとしている。

「An expressive oil painting of a basketball player dunking, depicted as an explosion of a nebula（ダンクシュートするバスケットボール選手を星雲の爆発として描いた油絵）」というプロンプトに対してDALL-E 2で生成された画像（左）とDALL-E 3で生成された画像（右）（提供：OpenAI）

ChatGPT上にネイティブに構築

　DALL-E 3はChatGPT上でネイティブに構築されており、ユーザーはChatGPTをブレインストーミングのパートナーとして、あるいはプロンプトを改善するために利用できる。

　ChatGPTにアイデアを伝えると、DALL-E 3は画像に変換させるための詳しいプロンプトを自動生成する。またDALL-E 3が生成した画像が自分の意図したものと少し違う場合、ChatGPTにごく短い指示で微調整を依頼することもできる。

　なお、DALL-E 2の場合と同様、DALL-E 3で作成した画像はユーザーのものであり、転載、販売、商品化に当たってOpenAIの許可は不要だという。

安全対策の取り組みも

　DALL-E 3は従来のバージョンと同様に、暴力的、アダルト、憎悪的なコンテンツの生成を制限する措置が講じられている。OpenAIは、画像がAIで作成されたものであることを人々が識別するのに役立つ方法も研究している。

　DALL-E 3は、現存するアーティストのスタイルの画像を求めるリクエストを拒否するように設計されている。クリエイターは、OpenAIの将来の画像生成モデルのトレーニングに、制作した画像が利用されることを拒否することもできる。

OpenAI、画像生成AIの最新版「DALL-E 3」を発表：ユーザーのアイデアを正確な画像に簡単に変換

画像生成能力が向上

ChatGPT上にネイティブに構築

安全対策の取り組みも

関連記事

関連リンク

Smart & Social 記事ランキング