テキストに基づく画像生成Stable DiffusionのJupyter notebookの共有と「呪文詠唱」パターンの紹介サイト

スポンサーリンク
Python

Stable Diffusion 2.0が公開されたので、テキストでの指示、通称”呪文”といわれるものも併せて共有してみたいと思います。

Stable Diffusion とは

「Stable Diffusion(ステーブル・ディフュージョン)」とは、テキスト入力されたワードからAIが自動で画像を生成する、オープンソースの画像生成AIサービスです。描画させたい画像の内容を文字入力すると、AIがテキストに応じた画像を数秒で作成してくれます。ただし、テキスト入力するキーワードは英語である必要があることと、綺麗な画像を出力するためのノウハウ、通称”呪文”と言われるような先人の玄人の皆さんが試行錯誤されてきたコマンドに似た指示文がありますので、それも併せてご紹介したいと思います。

使用するツール

使用するツールはGoogle Colaboratoryのpythonを使いますので、無料で、簡単に行うことができます。Google Colaboratoryについては以前書いた記事をご参照いただければと思います。

実際のコードとやっていること

今回使ったコードはGoogle Colabのファイルとして以下にシェアしてあります。

Open In Colab

内容についてはあまり詳しくないので、使い方という部分を紹介します。

Shift+Enterで各枠を実行していくと今回の場合は以下のような画像が生成されます。

今回の画像制作の指示文は

prompt = "temple in ruines, forest, stairs, columns, cinematic, detailed, atmospheric, epic, concept art, Matte painting, background, mist, photo-realistic, concept art, volumetric light, cinematic epic + rule of thirds octane render, 8k, corona render, movie concept art, octane render, cinematic, trending on artstation, movie concept art, cinematic composition , ultra-detailed, realistic , hyper-realistic , volumetric lighting, 8k –ar 2:3 –test –uplight"

というような”呪文”になります。DeepLでの日本語訳では

廃墟の寺院、森、階段、柱、映画的、詳細、大気、叙事詩、コンセプトアート、マットペイント、背景、霧、フォトリアル、コンセプトアート、ボリュームライト、映画的叙事詩+三分の一ルール octane render, 8k, corona render, movie concept art, octane render, cinematic, artstationでトレンド, 映画コンセプトアート、映画的構成 , 超詳細、リアル、超リアル、ボリュームライト、8k -ar 2: 3 -test -uplight"

という事になります

また、RuntimeとしてGPUをつかう設定であることに気を付けてください。

”呪文”はちょっとしたノウハウがあると思いますが、プログラムコード的には基本的に上から流すだけですので、自分の気に入る画像が作成できればいいかなと思います。

参考にさせていただいたサイト

Stable Diffusion 2.0で追加された機能を試してみよう
Stable Diffusion 2.0で可能になった768×768ピクセルの画像生成、画像のアップスケール、画像の一部の書き換えとはどんなものかを見ていきます。

Stable Diffusion 2.0がリリース!Pythonでの使い方を解説 | Murasan Lab
今回は画像描画AI、Stable Diffusionの新しいバージョンである2.0がリリースされましたので、使い方を解説します。ローカルのPCやGoogle Colabで実行するためのPythonコードも併せて掲載していますので、ぜひトライ

Stable Diffusion を Google Colab でシンプルに体験する方法 - ガンマソフト
「言葉で欲しい絵を伝えれば、AIが描いてくれる」、まさに夢のようなAIが近年注目されています。その代表的なAIの一つである「Stable Diffusion(ステーブル・ディフュージョン)」が2022...

以下が「呪文詠唱」パターン集になります。

朽ちた遺跡のような建造物:中世の城:実在しない日本の風景

Stable Diffusion 呪文探しの旅 《幻想世界の風景を生み出すPrompt》 Part 2 | Murasan Lab
画像を生成できるAI、StableDiffusionに絵を描かせるための指示(Prompot)は呪文と呼ばれ、どのような呪文を指示するかによって出力されるイラストが大きく変わります。独自の呪文で美しいイラストを描くためには膨大な試行回数を必

「女性画像」:「サイバーパンクな戦争」:「妖精の村」

Stable Diffusion「呪文詠唱」パターン集!見習い召喚士必見!
MidjourneyやStable Diffusionで「なかなか呪文詠唱がうまくいかない」とお悩みの召喚士さんのために「呪文詠唱(prompt)」&召喚画像を共有!

Pythonに関する記事をご紹介します。

Python高速化! for文は遅いので、”これ”を使うと30倍早いですよ!【Google ColabのPython:コピペで動く!】
【コピペで動く!】Pythonで1.5GBのcsvファイル読み込み高速化:1分5秒⇒4秒程度 DASK , pickle (Pythonコードあり)
【コピペで動く!】日本株、米国株で個別銘柄ベータ値(β値)を簡単に調べる方法 Python 米国株 Webサービス&コード 【Google Colabで違いをみつけろ!】
【コピペで動く!】20行で資産運用モデル作成 Google ColabのPythonで 米国株の株価を取得し、グラフ・チャートを表示
【コピペで動く!】Google ColabでPython を用いての 効率的フロンティア と ポートフォリオの最適化 Efficient Frontier & Portfolio Optimization with Python [Part 2/2]
過去50年間のS&P500の季節性の値動きから負けにくいポジション構築はできるのか考える・大統領選挙のアノマリー対応!【コピペで動く!】Google ColabのPythonで自分で調べてみよう!
【解決】Google ColabのPythonでエクセル(Excel)ファイルやCSVファイルに出力・入力する方法【コピペで動く!】
【解決】スクレイピングでHTTP Error 403: Forbiddenでアクセスできないときに試すべき方法【コピペで動く!】【Google Colab:Python:pd.read_html,selenium】
曜日による米国株指数(S&P500)のパフォーマンスに違いはあるのか?有利なポジション取りはできるのか?【Google ColabのPython:コピペで動く!】Twitterで出てくる知見は本当か自分で調べてみよう。
【コピペで動く!】IB証券(インタラクティブ・ブローカーズ証券 )へのPythonでのAPI接続 ib_insync [自分が使っているPythonコード]
【コピペで動く!】20行で資産運用モデル作成 長期、中期、短期の3区分の期間チャートをGoogle ColabのPythonで作成 【違いをみつけろ!】
Google ColabでYouTube動画を開始・終了の時間を指定してPythonでダウンロード(音声・動画両方対応)【コピペで動く!】
ボラティリティ クラスタリング(Volatility Clustering)について:Google ColabのPythonでの相場環境分析
米国株のティッカー(Symbol)のスクレイピングによる取得、APIによるヒストリカルデータやファンダメンタルズデータ取得について【コピペで動く!】Python,Quandl,無料枠あり
対話型チャットAI「ChatGPT」が人気なので、アカウントの作成とか難しいことが分からない人向けにとりあえずBlogに埋め込んでみた!

コメント

タイトルとURLをコピーしました