Stability AI、無料で利用できる「Stable Diffusion 3.5 Large」に3種類の「ControlNet」を追加 何ができる?追加の入力画像でStable Diffusionを制御

Stability AIは、画像生成モデル「Stable Diffusion 3.5 Large」の3種類の新しい「ControlNet」を提供開始した。

» 2024年12月02日 08時00分 公開
[@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 Stability AIは2024年11月26日(米国時間)、画像生成モデル「Stable Diffusion 3.5 Large」の3種類の新しい「ControlNet」を提供開始した。内訳は「Blur」「Canny」「Depth」だ。

 ControlNetは、追加の入力画像でStable Diffusion 3.5 Largeを条件付け、制御するためのモデルの一種。3.5 Largeを使って正確かつ簡単に画像を生成するために必要なツールと位置付けられる。さまざまな入力に対応しており、インテリアデザインからキャラクター制作まで、幅広い用途に最適だと、Stability AIは述べている。

追加された3種類のControlNetで何ができる?

 新しい3種類のControlNetはStability AI Community Licenseに基づいて、商用(年間売上高100万ドルまで)、非商用にかかわらず、無料で使用できる。年間売上高が100万ドルを超える企業は、エンタープライズライセンスを契約する必要がある。

 これらのControlNetは、重みについてはHugging Faceから、コードについてはGitHubからダウンロードできる。Comfy UIでもサポートされている。

 Blur、Canny、Depthの概要は以下の通り。

Blur

 8Kや16Kなど、高解像度で極めて忠実度の高い画像へのアップスケーリングを実現する。低解像度の画像を大きく精細なビジュアルにタイリングするのに最適だ。

Blurの適用例(提供:Stability AI)

Canny

 Cannyエッジマップを利用して、入力画像から線画を抽出し、それを基に画像を生成する。特にイラストに便利だが、あらゆるスタイルに適応できる。

Cannyの適用例(提供:Stability AI)

Depth

 DepthFMによって生成された深度マップを使用して、画像生成をガイドする。建築レンダリングや3Dアセットのテクスチャリングなど、画像の構図を厳密に制御する必要がある場合に最適だ。

Depthの適用例(提供:Stability AI)

 約150人が参加した同種の制御に関するELO比較調査(※)で、Stable Diffusion 3.5 LargeのControlNetが、類似モデルの中でユーザーから最も高い評価を得た。

(※)チェスなどで使われるELOレーティングシステムを応用しLLM間の相対的な実力を数値化したもの

ELOスコアで見たControlNetの評価(提供:Stability AI)

Copyright © ITmedia, Inc. All Rights Reserved.

スポンサーからのお知らせPR

注目のテーマ

Microsoft & Windows最前線2025
AI for エンジニアリング
ローコード/ノーコード セントラル by @IT - ITエンジニアがビジネスの中心で活躍する組織へ
Cloud Native Central by @IT - スケーラブルな能力を組織に
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。