Stable Diffusionで画像を生成するとき「自分のイメージ通りのポーズを指定したいが、プロンプト(呪文)で上手く言語化できない…。」と考えたことはありませんか?
また、イメージ通りの画像をなかなか生成できなかったり、出たばかりの生成AIにまだ慣れない人も多いと思います。
今回は、画像生成AIであるStable Diffusionを使いこなせるように、Stable Diffusionで活用できるプロンプト(呪文)のアイデア集をまとめました!是非参考にしてみてください!
目次
第一章 Stable Diffusion ポーズ指定プロンプト集
Stable diffusionでポーズを指定したい時に使えるプロンプトを集めました。
下記で紹介する「ポーズのカテゴリ」では単体のプロンプトの紹介ですが、第二章で説明する「プロンプトを複数個組み合わせる方法」を活用することで、よりイメージに近い画像を生成できるようになるはずです。
まずは、ポーズ毎のプロンプトをある程度把握しましょう。
ポーズのカテゴリ
全身のポーズに関するプロンプトアイデア集
立ち
- 基本立ち:Basic Standing
- 片足立ち:Standing on one leg
- 交差立ち:Legs Cross-standing
- 軍事立ち:Military Standing
- 前傾立ち:Leaning forward
- 片膝立ち:Standing on one knee
- 反り腰立ち:Warped Waist Standing
- つま先立ち:Tiptoe
- 腕組み立ち:Arms crossed-standing
- 片手腰立ち:One-handed waist-standing
- 両手腰立ち:Standing on both hands
- ダンディ立ち:Dandy Standing
- リラックス立ち:Relaxed Standing
- アクティブ立ち:Active Standing
座り
- 正座:Seiza
- あぐら;Agra
- 横坐り:Sitting on the side
- 膝立ち:Kneeling
- 端座り:Sitting on the edge
- 前傾座り:Sitting Forward Leaning
- 椅子座り:Chair sitting
- 腕組み座り:Sitting with your arms crossed
- 足を組んで座る:Sit cross-legged
- リクライニング座り:Reclining sitting
歩き
- 早歩き:Brisk walking
- 猫歩き:Cat walking
- ステップ:Steppe
- 軍隊歩行:Army Walk
- モデル歩行:Model Walking
- ゆっくり歩き:Walk slowly
- カジュアル歩行:Casual Walking
- ダックウォーク:Duck Walk
走る
- リレー走:Relay run
- ジョギング:Jogging
- スプリント:Sprint
- マラソン走:Marathon running
- ハードル走:Hurdle running
- トレイルランニング:Trail Running
- バックワードランニング:Backward Running
- インターバルランニング:Interval Running
- 障害物レース走;Obstacle Race Running
ジャンプ
- 縦跳び:Longitudinal Jump:
- 横跳び:Side jump
- 走り幅跳び:Long Jump
- ハイジャンプ:High Jump
- バックフリップ:Backflip
- ポールボールト:Pole Vault
- ロングジャンプ:Long Jump
- トリプルジャンプ:Triple Jump
- フロントフリップ:Front Flip
- バンジージャンプ:Bungee jumping
その他
- 逆立ち:Handstand
- 後ろ向き:Retrospective
- ワイドショット:wide shot,very wide shot(広角)
- 手を挙げている:Raising hands
- ゾンビのポーズ:Zombie Pose
- 両手を広げている:Arms outstretched
- 手を前に出している:Hands in front of you
- 両手で物を抱えている:Holding an object with both hands
- ファイティングポーズ:fighting pose,fighting stance
第二章 ポーズに関するプロンプトを使いこなす方法
プロンプトを英語で入力する
プロンプトは英語で入力した方が、イメージ通りの出力を得やすくなります。もちろん日本語や他の言語でも画像を生成することは可能ですが、言語によって生成される画像の質や精度などが変わってきます。
これは一般的に、英語はデータセットが豊富でモデルが意味を解釈しやすいからです。
モデルやLoraを活用する
Stable Diffusionを用いた画像生成では、プロンプトに加えて、活用するモデルやLoraの種類も生成される画像のクオリティに大きな影響を与えます。
モデルは画像を生成するための基本のアルゴリズムのことで、Loraはモデルのアルゴリズムに対して独自のカスタマイズを加えられるファイルのことです。
例えば、写真に近い画像を生成するのに特化したモデルと、特定のアニメキャラを生成するためのLoraを組み合わせると、リアリティの高いアニメキャラの画像を生成可能です。
⇨おすすめモデルや、モデルの入れ方についてはこちらをご覧ください
→おすすめLoraや、Loraの入れ方についてはこちらをご覧ください
アスペクト比率を変更する
アスペクト比率とは、画像の幅と高さの比率のことです。アスペクト比率を変更することで、ピクセル数が変わったり、画像の範囲や余白が変わります。
例えばプロンプトでポーズの指示を出すとき、横長の比率にすると寝ている画像を生成しやすくなり、縦長の画像にすると立ち姿の画像を生成しやすくなります。
試行回数を増やす
Stable Diffusionでは同じプロンプトを2回入れたとき、全く同じ画像が生成されるわけではありません。
的確なプロンプト、アスペクト比率の調整ができていたとしても、イメージ通りの画像が2回目で生成される時もあるため、運の要素も絡んできます。自分のイメージ通りの画像を生成するためには、ある程度の試行回数が必要となってくるでしょう。
しかし、そもそもプロンプト自体が正しく設定されていないと何度生成しても自分のイメージ通りの画像は生成されませんので、生成した画像がある程度イメージしている内容に近づいたら微調整を繰り返すと良いでしょう。
複数のプロンプトを組み合わせる
よりイメージに近い画像を生成するために、必要となるのが複数のプロンプトを組み合わせることです。プロンプトは具体的で詳細な内容であるほど、イメージ通り忠実に画像が生成されます。
プロンプトを複数個使うと、プロンプト単体よりも具体的な指示を出すことができるため、イメージに近い画像を生成することが可能になります。
第三章 ポーズの指定に使えるStable diffusion拡張機能
OpenPose Editor
プロンプトのみで画像を生成しようとすると、なかなかイメージ通り画像を生成することができないことも多々あると思います。そこで紹介したいのが「OpenPose Editor」というStable Diffusionの拡張機能です。(利用はこちら)
OpenPose Editorを使用すると、あらかじめ好きなポーズを指定した状態から画像を生成できるので、プロンプト(呪文)で指示する内容を大幅に省略でき、効率化にも繋がります。
また、次に紹介する拡張機能「ControlNet」と組み合わせることで、同じポーズのまま背景や服装、髪型などを変えることができるようになります。
ControlNet
「ControlNet」は画像を読み込ませることで、ポーズはそのままで、背景や髪色のみを変えることができます。
先述したOpenPose Editorと組み合わせると、指定したポーズで画像生成したあとにポーズをそのままで背景を変える、という流れを実現できるため、自分のイメージ通りの画像をプロンプトなしで効率的に生成できます。
第四章 まとめ
Stable Diffusionで画像を生成する際に使えるプロンプトや拡張機能をまとめてみましたが、いかがでしたでしょうか。
何事も慣れが肝心なので、試行回数を増やし、生成AIを使いこなしてより質の高い画像を生成できるようになりましょう。
この記事は役に立ちましたか?
もし参考になりましたら、下記のボタンで教えてください。
コメント