テキストに基づく画像生成Stable DiffusionのJupyter notebookの共有と「呪文詠唱」パターンの紹介サイト

Python

2022.12.07

Stable Diffusion 2.0が公開されたので、テキストでの指示、通称”呪文”といわれるものも併せて共有してみたいと思います。

Stable Diffusion とは
使用するツール
実際のコードとやっていること
参考にさせていただいたサイト

Stable Diffusion とは

「Stable Diffusion（ステーブル・ディフュージョン）」とは、テキスト入力されたワードからAIが自動で画像を生成する、オープンソースの画像生成AIサービスです。描画させたい画像の内容を文字入力すると、AIがテキストに応じた画像を数秒で作成してくれます。ただし、テキスト入力するキーワードは英語である必要があることと、綺麗な画像を出力するためのノウハウ、通称”呪文”と言われるような先人の玄人の皆さんが試行錯誤されてきたコマンドに似た指示文がありますので、それも併せてご紹介したいと思います。

使用するツール

使用するツールはGoogle Colaboratoryのpythonを使いますので、無料で、簡単に行うことができます。Google Colaboratoryについては以前書いた記事をご参照いただければと思います。

実際のコードとやっていること

今回使ったコードはGoogle Colabのファイルとして以下にシェアしてあります。

内容についてはあまり詳しくないので、使い方という部分を紹介します。

Shift+Enterで各枠を実行していくと今回の場合は以下のような画像が生成されます。

今回の画像制作の指示文は

prompt = "temple in ruines, forest, stairs, columns, cinematic, detailed, atmospheric, epic, concept art, Matte painting, background, mist, photo-realistic, concept art, volumetric light, cinematic epic + rule of thirds octane render, 8k, corona render, movie concept art, octane render, cinematic, trending on artstation, movie concept art, cinematic composition , ultra-detailed, realistic , hyper-realistic , volumetric lighting, 8k –ar 2:3 –test –uplight"

というような”呪文”になります。DeepLでの日本語訳では

廃墟の寺院、森、階段、柱、映画的、詳細、大気、叙事詩、コンセプトアート、マットペイント、背景、霧、フォトリアル、コンセプトアート、ボリュームライト、映画的叙事詩+三分の一ルール octane render, 8k, corona render, movie concept art, octane render, cinematic, artstationでトレンド, 映画コンセプトアート、映画的構成 , 超詳細、リアル、超リアル、ボリュームライト、8k -ar 2: 3 -test -uplight"

という事になります

また、RuntimeとしてGPUをつかう設定であることに気を付けてください。