画像生成AI「Stable Diffusion」の実行環境を構築するには? Dockerが解説:「WSL 2」「Docker Desktop」「AUTOMATIC1111」を活用
Dockerは「Stable Diffusion」の実行環境を容易に構築する方法として「Docker Desktop for Windows」および「Windows Subsystem for Linux 2(WSL2)」を活用した手順を解説した。
Dockerは2023年7月11日(米国時間)、画像生成AI「Stable Diffusion」の実行環境を容易に構築する方法として「Docker Desktop for Windows」および「Windows Subsystem for Linux 2(WSL2)」を活用した手順を解説した。
Stable Diffusionは、プロンプトと呼ばれるテキストから高解像度画像を生成する能力によって、クリエイティブなデザイン、ビジュアルストーリーテリング、コンテンツ生成などさまざまな分野で新たな可能性を開くものとして注目を集めている。Stable Diffusionはオープンソースであり、多くの研究者や開発者にとって、頼りになるツールの1つとなっている。
Stable Diffusionの環境構築にDocker Desktopを利用するメリットは?
Dockerは、画像をベースとする生成AI分野において、ツールやフレームワークの準備に加えてソフトウェアの依存関係や互換性の問題を考慮する必要があり、開発環境の構築や効率的な実行環境の整備が課題になるとした上で、Docker Desktopのようなコンテナプラットフォームが重要だと指摘した。
「Docker Desktopを利用すると、生成AIワークフローに必要な全てのコンポーネントと依存関係をカプセル化した分離環境を構築できる。手作業でのソフトウェアインストールは不要になり、ライブラリバージョンの競合、構成に伴う複雑さを解消できる」
Stable Diffusion WebUIとは
Stable Diffusion WebUIは、Gradioと呼ばれるPythonライブラリをベースに構築されたブラウザインタフェースであり、Stable Diffusionの利用を容易にする手段として提供されている。
Dockerは、Stable Diffusion WebUIを実行する環境構築に複数のステップが必要なため、面倒で時間のかかるプロセスだと指摘。「Stable Diffusion WebUI Docker」というオープンソースプロジェクトを活用することで、Dockerを用いて簡単に環境を構築し実行できるとした。
DockerでStable Diffusionの環境を構築するには
Dockerは「Docker Compose」を用いてStable DiffusionにWeb UIからアクセスできる「AUTOMATIC1111」の環境を構築する方法を次のように解説した。
- WSL 2を有効化し、Docker Desktopをインストールする
- 「stable-diffusion-webui-docker」のコードをGitHubリポジトリからダウンロードする
- ダウンロードしたフォルダ内で「docker compose --profile download up --build」を実行して、インストールする
- インストール後、「docker compose --profile auto up --build」でAUTOMATIC1111を起動する
- ブラウザで「http://127.0.0.1:7860」にアクセスする
Docker Composeは、複数のDockerコンテナを実行、管理するツール。あらかじめ定義されたネットワーク、ボリューム、依存関係などの設定をもとに、コンテナの作成や実行、停止を行う。stable-diffusion-webui-dockerリポジトリ内にある「docker-compose.yml」を確認することで定義内容を確認できる。
記事では、Dockerに精通している読者向けにタイムゾーンの設定変更や、構築時のトラブルシューティングについても解説している。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 誰もが知っておくべき画像生成AI「Stable Diffusion」の仕組みと使い方
Stable Diffusionの概要と基本的な仕組み、それを簡単に使うための公式なWebサービスである「DreamStudio」を紹介し、Stable Diffusionで画像生成する際に行われていることについて駆け足で見ていきましょう。 - Stable Diffusion 2.0で追加された機能を試してみよう
Stable Diffusion 2.0で可能になった768×768ピクセルの画像生成、画像のアップスケール、画像の一部の書き換えとはどんなものかを見ていきます。 - 「Stable Diffusion」で話題のStability AIが、テキスト生成言語モデルを公開
Stability AIは、テキストやコードを生成できる、オープンソースの言語モデル「StableLM」を公開した。「CC BY-SA-4.0」ライセンスに基づき、研究だけでなく、商用目的でも利用できる。