皆さんはStable Difffusionを利用していますか?
画像生成AIとして非常に性能が高く、特にリアルな画像やアニメ風の画像を生成する際に用いられるStable Diffusionですが、使いこなすためには様々な技術が必要となります。
その中でも特に今回紹介する呪文(プロンプト)は重要な役割を担います。この記事では、Stable Diffusionの呪文(プロンプト)について詳しく解説していきます。
目次
第1章 Stable diffusionにおける呪文(プロンプト)とは
1-1 Stable diffusionとは
Stable Diffusionは文章を元に画像を生成可能な画像生成AIの一種です。
AIを使った画像生成AIはいくつもありますが、その中でもこのStable diffusionがおすすめなのは、何といってもオープンソースAIとして全世界に公開されているため、Web版であれば誰でも無料で画像生成が可能である点です。
また、作成枚数に制限がないというのも他の画像生成AIとの大きな違いです。無制限にアニメのイラストやリアルな人物画像まで、様々なコンテンツの画像を生成することができます。
Stable Diffusionを使用するには、Web版を使う方法とローカル版を使う方法の2種類があります。それぞれの方法について以下で詳しく解説しています。
⇨Stable Diffusion ローカル版(webUI)の利用方法
1-2 Stable Diffusionの呪文(プロンプト)とは?
呪文とは、Stable Diffusionのような画像生成AIに入力する指示のことで、特に文章を指すことが多いです。こんなイラストを生成してほしいという命令を出す役割を担います。呪文の項目としては次のようなものがあります。
POINT・画像の品質、クオリティ 例: 高解像度、写真家の作品、アートギャラリー品質
・カメラフォーカス 例: パンフォーカス、セレクティブフォーカス、鮮明な前景とぼやけた背景
・ライト 例: 日の出の光、ソフトな照明、ドラマティックな影
・構図 例: 対角線構図、上半身のポートレート、ダイナミックなアングル
・人物 例: 30歳の男性、10代のスポーツ選手
・気候・天候 例: 雪が降る風景、晴れた夏の日、霧の中
・時間帯 例: 日没時、夜明け、真昼
・動物・ペット 例: 友好的な犬、野生の鳥、猫が寛ぐ姿
・アクセサリー・小物 例: 色とりどりの帽子、ヴィンテージの時計、ハンドバッグ
・建築・建物 例: 古典的な城、モダンなオフィスビル、小さな村の家
・ポーズ 例: 走っている姿勢、カメラを見つめる横顔
・背景 例: 自然の中、都市の夜景
・髪型 例: 短髪、カーリーヘア
・服装 例: イブニングドレス、カジュアルなジーンズとシャツ
・表情 例: 思慮深い、楽しそうな笑顔
生成するイラストに対して呪文を指定すれば、命令の通りに作成されるわけですが、同じ呪文に対して全く同じイラストが生成されるわけではありません。ランダムな要素も入ってくるのです。
そのため、呪文(プロンプト)を考える際には試行錯誤という面があり。あれこれ考えながら入力していく必要があります。
Stable Diffusionに呪文を入力する際のポイントがあるので、チェックしておきましょう。
POINT・順番が先のものが優先される
・単語数の上限は75
・大切な部分には括弧などをつけて強調
・呪文の効きを弱める箇所も必要
・モデルごとに推奨されている呪文がある
・書き方は、「イラスト全体の要素」⇒「登場人物」⇒「登場人物の外見要素(服装や髪型など)」⇒「構図」の順番が一般的
⇨Stable Diffusionのモデルについて詳しくはこちらの記事をご覧ください
第2章 Stable diffusion 呪文(プロンプト)の一覧
Steble Diffusionで画像生成する上で役立つ呪文(プロンプト)を一覧で紹介していきます。
画像を高品質・高画質・高解像度にする呪文(プロンプト)
- best quality-最高品質
- high quality-高品質
- masterpiece-傑作
- exquisite-この上なく素晴らしい
- beautiful-美しい
- high res-高解像度
- absurdres-とても高解像度
- 8k-8K画像を意識した画質
これらの呪文は基本的に単体ではなく合わせて入力することが一般的です。
特にmasterpieceは効果が高いとされているので外さないようにしましょう。
画像のリアルさを高める呪文(プロンプト)
- real person:実在の人
- photo realistic:写実的な
- realistic:現実的な
- shiny skin:光沢のある肌
- detailed face:細部まで描写された顔
- detailed eyes:細部まで描写された目
構図やアングルに関する呪文(プロンプト)
- dutch angle:カメラを傾けて撮影
- from above:上からのアングル
- from below:下の方からのアングル
- low angle:低いアングル
- dynamic angle:ダイナミックアングル
- from behind:背中から
- from front:前から
- from side:横から
- from above:斜め上から
- upside-down:逆さ撮り
- symmetry :対称性
- full body:全身
- upper body:上半身
- lowerbody:下半身
- portrait:肩+顔
- cowboy shot:太ももから上
- wide shot:遠景
- very wide shot:超遠景
- close-up:(特定の部位の)クローズアップ
- face close up:顔を拡大した構図
- chest focus:胸を中心として構図
こちらは画質などとは異なり数多くの組み合わせではなく、特定の状況を想定し、それに合わせた呪文を選びましょう。
全身の場合は縦長比率を設定すると、うまくイラストが生成されます。
明るさ・絵柄に関する呪文
イラストの明るさについては、自然光や光の角度に関する呪文が役に立つでしょう。
- bloom:明るい自然光
- sunlight:日の光
- sunbeam:太陽光線
- dappled sunlight:木漏れ日
- moonlight:月光
- darkness:暗闇
- backlighting:逆光
- sidelighting:サイドからの光
- underlighting:下からの光
- spotlight:スポットライト
- stage lights:ステージライト
- glowing:輝く
絵柄に関する呪文
- ukiyo-e:浮世絵
- sumi-e:墨絵
- 1990s:1990年代らしい絵
- lineart:線画
- sketch:スケッチ
- realistic:写実的
- monochrome:モノクロ
- impressionism:印象派
- animification:アニメ化
- comic:漫画の表紙
- cartoonized:漫画風
- vincent van gogh:ゴッホ
- claude monet:モネ
体型やポーズに関する呪文
- Curvy:曲線美のある
- Chubby:ぽっちゃり
- Petite:小柄な
- Powerful pose:力強いポーズ
- Dynamic pose:動きのあるポーズ
- Lie on stomach:うつ伏せになる
- Tiptoe:つま先立ち
- Lie down:横たわる
- Place hand on chest:手を胸に当てる
- Lie on your side:寝そべる
- Scratch head:頭をかく
- Rest head on hand:頬杖
⇨ポーズに関する呪文に関して詳しくはこちらの記事で紹介しています。
性別・年齢・人種に関する呪文(プロンプト)
- woman:女性
- girl:女の子(高校生くらいまで)
- female child:女の子(小学生くらい)
- loli:女の子(小学生くらい)
- mature female:熟女
- old woman:老女
- boy:少年
- male focus:男性に焦点をあてる
- bishounen:美少年
- male child:男の子(小学生くらい)
- shota:男の子(小学生くらい)
- mature male:大人の男性・おっさん
- old man:老人
- 2 girls:女性2人
- yuri:女性2人
- 2 boys:男性2人
- couple:男女
- multiple girls:複数人の女性
- 6+girls:複数人(大勢)
- no humans:人間がいない
- american・europianなど:アメリカ人やヨーロッパ人
- african・dark skin:アフリカ人・黒人
- asian:アジア人
- japanese:日本人
- elf:エルフ
- dark elf:ダークエルフ
- angel:天使
- demon:悪魔
- monster:モンスター
- fairy:妖精
- medusa:メドゥーサ
- vampire:ヴァンパイア
- zombie:ゾンビ
表情・顔のパーツに関する呪文(プロンプト)
- smile:笑顔
- light smile:微笑み
- evil smile:邪悪な笑顔
- :d:口を開けた笑顔
- :p:舌を出す
- grin:ニヤリと笑う
- evil grin:邪悪な笑み
- sad smile:悲しげな微笑み
- angry:怒り
- annoyed:イライラ
- furious:激怒
- disgust:嫌悪
- frown:しかめっ面
- glaring:にらむ
- scowl:にらむ・くっころ
- sad:悲しみ
- tears:涙
- streaming tears:流れる涙
- wiping tears:涙を拭う
- crying:大泣き
- sobbing:号泣
- jitome:ジト目
- blue eyes・black eyesなど:目の色
- tsurime:つり目
- tareme:垂れ目
- upturned eyes:上目遣い
- heterochromia:オッドアイ
- wide-eyed:目を見開く
- heart-shaped pupils:ハート形の瞳
服装に関する呪文(プロンプト)
- t-shirt:Tシャツ
- blouse:ブラウス
- coat:コート
- cardigan:カーディガン
- sweater:セーター
- hoodle:パーカー
- raincoat:レインコート
- tank top:タンクトップ
- skirt:スカート
- pants:パンツ(下着ではなく)
- shorts:ショーツ
髪型・髪色に関する呪文(プロンプト)
- twintails:ツインテール
- low twintails:低い位置でのツインテール
- short twintails:短めのツインテール
- ponytail:ポニーテール
- side ponytail:サイドポニーテール
- bob cut(okappa):ボブカット
- hime cut:お姫様カットなど
- shiny hair:光沢のある髪
- black hair:黒髪
- blonde hair:金髪
- pink hair:ピンク色の髪
- white hair:白髪
- colored inner hair:内側の色が違う髪
- two-tone hair:ツートーン(2色)の髪
- streaked hair:一筋だけ色が違う髪
第3章 Stable diffusionにおける特殊な呪文について
これまで述べた通り、Stable diffusionで画像を生成するには適当なプロンプト(呪文)を入力する必要があります。
ただし、プロンプト(呪文)の中には上記に分類されないと特殊なものも存在します。この章ではそれらのプロンプト(呪文)について紹介します。
ネガティブプロンプトについて
ネガティブプロンプトは通常のプロンプトとは異なり、「生成してほしくない画像の特徴」を表現したものです。
例えば、Stable DIffusion Web UIの利用画面は以下の画像のようになっています。
こちらの「1,プロンプトを入力」内には二つの入力欄が存在します。このうち上の枠に通常のプロンプトを、下の枠にネガティブプロンプトを入力します。
WebUI以外においてもこのようにネガティブプロンプトの入力欄は存在することが多いです。
では、具体的にどのようなネガティブプロンプトがあるのか?その代表例を紹介します。
- out of focus-ピントが合っていない
- ugly-酷い
- Uneven Teeth – 不揃いの歯
- deformed eyes-目が歪んでいる
- Irregular Patterns-不規則なパターン
- Irregular Patterns-不規則なパターン
- Lack of Symmetry (対称性の欠如)
- Confusing Layout (わかりにくいレイアウト)
などです。ネガティブプロンプトについて詳しくは以下の記事をご覧ください。
拡張機能限定の呪文「EasyNegative」
他にも特殊な呪文(プロンプト)として、拡張機能を導入した場合に有効となるものが存在します。
具体的には「EasyNegative」という美少女イラスト生成モデルに使える拡張機能があります。
「EasyNegative」には、生成画像の質をネガティブプロンプトを用いて高品質へと調整する機能があります。先ほど紹介したネガティブプロンプトを毎回全て入力するのは手間ですが、この拡張機能を使えば、「EasyNegative」と入力するだけで、
ダウンロードはこちらのHugging Faceから可能です。
導入後に、ネガティブプロンプトに「EasyNegativeV2」と入力すれば、複数のネガティブプロンプトを入力せずとも高品質な画像の生成が可能となります。
まとめ
Stable diffusionは、画期的な生成AIですが、使いこなすにはテクニックが必要です。特に、呪文をどのように使用するかにより生成される画像の質に大きな影響が生じます。
例えば、「犬」を生成する場合に、「白い長めの毛並みで大きな目をした中型犬」とするとより具体的な犬が生成できます。
この記事でご紹介したプロンプトを活用してぜひ高品質な画像を生成してみてください!!
この記事は役に立ちましたか?
もし参考になりましたら、下記のボタンで教えてください。
コメント