テキストに基づく画像生成Stable DiffusionのJupyter notebookの共有と「呪文詠唱」パターンの紹介サイト

スポンサーリンク
Python

Stable Diffusion 2.0が公開されたので、テキストでの指示、通称”呪文”といわれるものも併せて共有してみたいと思います。

Stable Diffusion とは

「Stable Diffusion(ステーブル・ディフュージョン)」とは、テキスト入力されたワードからAIが自動で画像を生成する、オープンソースの画像生成AIサービスです。描画させたい画像の内容を文字入力すると、AIがテキストに応じた画像を数秒で作成してくれます。ただし、テキスト入力するキーワードは英語である必要があることと、綺麗な画像を出力するためのノウハウ、通称”呪文”と言われるような先人の玄人の皆さんが試行錯誤されてきたコマンドに似た指示文がありますので、それも併せてご紹介したいと思います。

使用するツール

使用するツールはGoogle Colaboratoryのpythonを使いますので、無料で、簡単に行うことができます。Google Colaboratoryについては以前書いた記事をご参照いただければと思います。

実際のコードとやっていること

今回使ったコードはGoogle Colabのファイルとして以下にシェアしてあります。

Open In Colab

内容についてはあまり詳しくないので、使い方という部分を紹介します。

Shift+Enterで各枠を実行していくと今回の場合は以下のような画像が生成されます。

今回の画像制作の指示文は

prompt = "temple in ruines, forest, stairs, columns, cinematic, detailed, atmospheric, epic, concept art, Matte painting, background, mist, photo-realistic, concept art, volumetric light, cinematic epic + rule of thirds octane render, 8k, corona render, movie concept art, octane render, cinematic, trending on artstation, movie concept art, cinematic composition , ultra-detailed, realistic , hyper-realistic , volumetric lighting, 8k –ar 2:3 –test –uplight"

というような”呪文”になります。DeepLでの日本語訳では

廃墟の寺院、森、階段、柱、映画的、詳細、大気、叙事詩、コンセプトアート、マットペイント、背景、霧、フォトリアル、コンセプトアート、ボリュームライト、映画的叙事詩+三分の一ルール octane render, 8k, corona render, movie concept art, octane render, cinematic, artstationでトレンド, 映画コンセプトアート、映画的構成 , 超詳細、リアル、超リアル、ボリュームライト、8k -ar 2: 3 -test -uplight"

という事になります

また、RuntimeとしてGPUをつかう設定であることに気を付けてください。

”呪文”はちょっとしたノウハウがあると思いますが、プログラムコード的には基本的に上から流すだけですので、自分の気に入る画像が作成できればいいかなと思います。

参考にさせていただいたサイト

Stable Diffusion 2.0で追加された機能を試してみよう
Stable Diffusion 2.0で可能になった768×768ピクセルの画像生成、画像のアップスケール、画像の一部の書き換えとはどんなものかを見ていきます。

Stable Diffusion 2.0がリリース!Pythonでの使い方を解説 | Murasan Lab
今回は画像描画AI、Stable Diffusionの新しいバージョンである2.0がリリースされましたので、使い方を解説します。また、Stable Diffusionに関するトピックを以下の記事でまとめていますので、あわせてご覧ください。

Stable Diffusion を Google Colab でシンプルに体験する方法 - ガンマソフト
「言葉で欲しい絵を伝えれば、AIが描いてくれる」、まさに夢のようなAIが近年注目されています。その代表的なAIの一つである「Stable Diffusion(ステーブル・ディフュージョン)」が2022...

以下が「呪文詠唱」パターン集になります。

朽ちた遺跡のような建造物:中世の城:実在しない日本の風景

Stable Diffusion 呪文探しの旅 幻想世界の風景を生み出すPrompt Part 2 | Murasan Lab
画像を生成できるAI、StableDiffusionに絵を描かせるための指示(Prompot)は呪文と呼ばれ、どのような呪文を指示するかによって出力されるイラストが大きく変わります。独自の呪文で美しいイラストを描くためには膨大な試行回数を必

「女性画像」:「サイバーパンクな戦争」:「妖精の村」

Stable Diffusion「呪文詠唱」パターン集!見習い召喚士必見!
MidjourneyやStable Diffusionで「なかなか呪文詠唱がうまくいかない」とお悩みの召喚士さんのために「呪文詠唱(prompt)」&召喚画像を共有!

Pythonに関する記事をご紹介します。

Python高速化! for文は遅いので、”これ”を使うと30倍早いですよ!【Google ColabのPython:コピペで動く!】
【コピペで動く!】Pythonで1.5GBのcsvファイル読み込み高速化:1分5秒⇒4秒程度 DASK , pickle (Pythonコードあり)
デコピコミンが全国(47都道府県)で、どの施設に出てくるか地図(Google Maps)で確認!!【ピクミン ブルーム(Pikmin Bloom)】(スタジアムピクミン対応!2022/12/04)
対話型チャットAI「ChatGPT」が人気なので、アカウントの作成とか難しいことが分からない人向けにとりあえずBlogに埋め込んでみた!
ネット上にあるPDFをChatGPT(OpenAI)で英訳したり和訳するウェブアプリをBlogに埋め込んでみた!
【コピペで動く!】Google ColabでPython を用いての 効率的フロンティア と ポートフォリオの最適化 Efficient Frontier & Portfolio Optimization with Python [Part 2/2]
【解決】スクレイピングでHTTP Error 403: Forbiddenでアクセスできないときに試すべき方法【コピペで動く!】【Google Colab:Python:pd.read_html,selenium】
Windows10で機械学習環境チェック CPU/GPUでTensorflowの作業時間はどのくらい違うのか、Google Colabとも比較してみた。(CUDA Toolkit,cuDNN)
【解決】Google ColabのPythonでエクセル(Excel)ファイルやCSVファイルに出力・入力する方法【コピペで動く!】
【コピペで動く!】20行で資産運用モデル作成 Google ColabのPythonで 米国株の株価を取得し、グラフ・チャートを表示
ConoHa WINGレンタルサーバーでPython! Webアプリcgiを動かす手順を紹介!3つの例あり【コピペで動く!】
株価時系列データを分析する上で正規化を行う事の重要性について紹介する【違いをみつけろ!】
【コピペで動く!】ビットコインなどボラティリティの大きな銘柄を対数で分析する(Google ColabでCSVデータの読み込みと文字列データを日付、数値データへ変換する前処理、対数正規分布、について)
Google Search ConsoleとPythonの連携方法【コピペで動く!】
IB証券(インタラクティブ・ブローカーズ証券)のAPIを利用して個別株、ETF、先物のヒストリカルデータの出力できるJupyter notebookファイルの提供

コメント

タイトルとURLをコピーしました