OpenAI、画像生成AIの最新版「DALL-E 3」を発表:ユーザーのアイデアを正確な画像に簡単に変換
OpenAIは、画像生成AIの最新版「DALL-E 3」を発表した。テキストに忠実な画像を生成する能力が飛躍的に向上している。
OpenAIは2023年9月21日(米国時間)、自然言語で記述された文章から画像を生成するAI(人工知能)の最新版「DALL-E 3」を発表した。
DALL-E 3は、従来のシステムよりもニュアンスやディテールを理解し、ユーザーのアイデアを忠実に再現する画像を生成する。9月21日の発表時点でリサーチプレビュー段階にあり、OpenAIが提供するChatGPTの有料プラン「ChatGPT Plus」と「ChatGPT Enterprise」のユーザーに、2023年10月からAPI経由で提供される予定だ。
画像生成能力が向上
OpenAIは、「最近登場した画像生成AIは、入力された単語や説明を無視する傾向があり、ユーザーはプロンプトエンジニアリングを学ぶ必要があった。だが、DALL-E 3は、与えられたテキストに忠実な画像を生成する能力が飛躍的に向上している」と述べている。
同じプロンプトでも、DALL-E 3が生成する画像は、DALL-E 2よりも大幅に改善されているとしている。
ChatGPT上にネイティブに構築
DALL-E 3はChatGPT上でネイティブに構築されており、ユーザーはChatGPTをブレインストーミングのパートナーとして、あるいはプロンプトを改善するために利用できる。
ChatGPTにアイデアを伝えると、DALL-E 3は画像に変換させるための詳しいプロンプトを自動生成する。またDALL-E 3が生成した画像が自分の意図したものと少し違う場合、ChatGPTにごく短い指示で微調整を依頼することもできる。
なお、DALL-E 2の場合と同様、DALL-E 3で作成した画像はユーザーのものであり、転載、販売、商品化に当たってOpenAIの許可は不要だという。
安全対策の取り組みも
DALL-E 3は従来のバージョンと同様に、暴力的、アダルト、憎悪的なコンテンツの生成を制限する措置が講じられている。OpenAIは、画像がAIで作成されたものであることを人々が識別するのに役立つ方法も研究している。
DALL-E 3は、現存するアーティストのスタイルの画像を求めるリクエストを拒否するように設計されている。クリエイターは、OpenAIの将来の画像生成モデルのトレーニングに、制作した画像が利用されることを拒否することもできる。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- OpenAI、企業用のAIアシスタント「ChatGPT Enterprise」を提供開始
ChatGPTを開発したOpenAIは企業用のAIアシスタント「ChatGPT Enterprise」のサービス提供を開始した。ChatGPT Enterpriseでの全ての会話は暗号化されるため、企業のプライバシーは保護されるという。 - OpenAIがWebクローラー「GPTBot」の文書を公開、クロールを禁止するには?
OpenAIがWebクローラー「GPTBot」の文書を公開した。同時に、個人情報などの扱い方やアクセスを禁止したり、カスタマイズしたりする方法なども記載している。 - 「Azure OpenAI Service」は1日100の新規顧客を獲得――Microsoft、AIビジネスの現在地は
Microsoftは企業のAI活用を支援するAzure AIインフラストラクチャおよびサービスの新展開を発表した。発表されたのは、Azure AIインフラストラクチャに含まれる「ND H100 v5」仮想マシンシリーズの一般提供開始と、「Azure OpenAI Service」のグローバル展開だ。