OpenAI、画像生成AIの最新版「DALL-E 3」を発表ユーザーのアイデアを正確な画像に簡単に変換

OpenAIは、画像生成AIの最新版「DALL-E 3」を発表した。テキストに忠実な画像を生成する能力が飛躍的に向上している。

» 2023年09月26日 10時00分 公開
[@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 OpenAIは2023年9月21日(米国時間)、自然言語で記述された文章から画像を生成するAI(人工知能)の最新版「DALL-E 3」を発表した。

 DALL-E 3は、従来のシステムよりもニュアンスやディテールを理解し、ユーザーのアイデアを忠実に再現する画像を生成する。9月21日の発表時点でリサーチプレビュー段階にあり、OpenAIが提供するChatGPTの有料プラン「ChatGPT Plus」と「ChatGPT Enterprise」のユーザーに、2023年10月からAPI経由で提供される予定だ。

画像生成能力が向上

 OpenAIは、「最近登場した画像生成AIは、入力された単語や説明を無視する傾向があり、ユーザーはプロンプトエンジニアリングを学ぶ必要があった。だが、DALL-E 3は、与えられたテキストに忠実な画像を生成する能力が飛躍的に向上している」と述べている。

 同じプロンプトでも、DALL-E 3が生成する画像は、DALL-E 2よりも大幅に改善されているとしている。

DALL-E 2で生成された画像DALL-E 3で生成された画像 「An expressive oil painting of a basketball player dunking, depicted as an explosion of a nebula(ダンクシュートするバスケットボール選手を星雲の爆発として描いた油絵)」というプロンプトに対してDALL-E 2で生成された画像(左)とDALL-E 3で生成された画像(右)(提供:OpenAI)

ChatGPT上にネイティブに構築

 DALL-E 3はChatGPT上でネイティブに構築されており、ユーザーはChatGPTをブレインストーミングのパートナーとして、あるいはプロンプトを改善するために利用できる。

 ChatGPTにアイデアを伝えると、DALL-E 3は画像に変換させるための詳しいプロンプトを自動生成する。またDALL-E 3が生成した画像が自分の意図したものと少し違う場合、ChatGPTにごく短い指示で微調整を依頼することもできる。

 なお、DALL-E 2の場合と同様、DALL-E 3で作成した画像はユーザーのものであり、転載、販売、商品化に当たってOpenAIの許可は不要だという。

安全対策の取り組みも

 DALL-E 3は従来のバージョンと同様に、暴力的、アダルト、憎悪的なコンテンツの生成を制限する措置が講じられている。OpenAIは、画像がAIで作成されたものであることを人々が識別するのに役立つ方法も研究している。

 DALL-E 3は、現存するアーティストのスタイルの画像を求めるリクエストを拒否するように設計されている。クリエイターは、OpenAIの将来の画像生成モデルのトレーニングに、制作した画像が利用されることを拒否することもできる。

Copyright © ITmedia, Inc. All Rights Reserved.

スポンサーからのお知らせPR

注目のテーマ

Microsoft & Windows最前線2025
AI for エンジニアリング
ローコード/ノーコード セントラル by @IT - ITエンジニアがビジネスの中心で活躍する組織へ
Cloud Native Central by @IT - スケーラブルな能力を組織に
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。