Stable Diffusion 2.0が公開されたので、テキストでの指示、通称”呪文”といわれるものも併せて共有してみたいと思います。
Stable Diffusion とは
「Stable Diffusion(ステーブル・ディフュージョン)」とは、テキスト入力されたワードからAIが自動で画像を生成する、オープンソースの画像生成AIサービスです。描画させたい画像の内容を文字入力すると、AIがテキストに応じた画像を数秒で作成してくれます。ただし、テキスト入力するキーワードは英語である必要があることと、綺麗な画像を出力するためのノウハウ、通称”呪文”と言われるような先人の玄人の皆さんが試行錯誤されてきたコマンドに似た指示文がありますので、それも併せてご紹介したいと思います。
使用するツール
使用するツールはGoogle Colaboratoryのpythonを使いますので、無料で、簡単に行うことができます。Google Colaboratoryについては以前書いた記事をご参照いただければと思います。
実際のコードとやっていること
今回使ったコードはGoogle Colabのファイルとして以下にシェアしてあります。
内容についてはあまり詳しくないので、使い方という部分を紹介します。
Shift+Enterで各枠を実行していくと今回の場合は以下のような画像が生成されます。


今回の画像制作の指示文は
prompt = "temple in ruines, forest, stairs, columns, cinematic, detailed, atmospheric, epic, concept art, Matte painting, background, mist, photo-realistic, concept art, volumetric light, cinematic epic + rule of thirds octane render, 8k, corona render, movie concept art, octane render, cinematic, trending on artstation, movie concept art, cinematic composition , ultra-detailed, realistic , hyper-realistic , volumetric lighting, 8k –ar 2:3 –test –uplight"
というような”呪文”になります。DeepLでの日本語訳では
廃墟の寺院、森、階段、柱、映画的、詳細、大気、叙事詩、コンセプトアート、マットペイント、背景、霧、フォトリアル、コンセプトアート、ボリュームライト、映画的叙事詩+三分の一ルール octane render, 8k, corona render, movie concept art, octane render, cinematic, artstationでトレンド, 映画コンセプトアート、映画的構成 , 超詳細、リアル、超リアル、ボリュームライト、8k -ar 2: 3 -test -uplight"
という事になります
また、RuntimeとしてGPUをつかう設定であることに気を付けてください。


”呪文”はちょっとしたノウハウがあると思いますが、プログラムコード的には基本的に上から流すだけですので、自分の気に入る画像が作成できればいいかなと思います。
参考にさせていただいたサイト



以下が「呪文詠唱」パターン集になります。
朽ちた遺跡のような建造物:中世の城:実在しない日本の風景

「女性画像」:「サイバーパンクな戦争」:「妖精の村」

—
Pythonに関する記事をご紹介します。
コメント