現在も様々なモデルが公開されている生成AIの世界。生成AIでは画像や文章の生成に「プロンプト」という文章を利用します。「プロンプト」とはAIと対話をする際にユーザーが入力する指示や質問のことです。
Stable Diffusionなどの画像生成AIにおいてはモデルに描いてほしい内容を指示する文章が「プロンプト」であり、「呪文」と呼ばれることもあります。
このプロンプトに対立する文章として「ネガティブプロンプト」という文章があります。「ネガティブ」は否定や反対を意味する言葉なので、「描いてほしくない内容」ということになります。今回の記事ではこの「ネガティブプロンプト」について詳しく紹介していきます。
目次
第1章 Stable Diffusionとネガティブプロンプトとは
Stable Diffusionとは
Stable Diffusionはオープンソースの画像生成AIです。プロンプトから画像を生成できる生成AIで、特にリアルな画像の生成に向いています。Stable diffusionはオープンソースであるため、Dream StudioやHugging faceなど様々なサービスを経由して使用することができます。
Stable Diffusionについて詳しくはこちらの記事をご覧ください
Stable Diffusionを簡単に利用できる『CIVITAI』についてはこちら
描きたい内容に近い画像をインターネット検索で探さなくとも、言葉によって思い描いた画像を生成することができます。例えば、「満開の桜の木の下に横たわる白いワンピースを着て帽子をかぶった少女」と入力すれば、その表現に近い画像が生成されます。
ネガティブプロンプトとは
Stable Diffusionではプロンプトを元に画像を生成できると紹介しましたが、プロンプトでは「生成して欲しい画像の特徴」だけでなく、「生成してほしくない画像の特徴」も盛り込むことが可能なのです。
その「生成して欲しくない画像の特徴」を示したプロンプトのことをネガティブプロンプトと呼びます。例えば、以下のような言葉をネガティブプロンプトの欄に入力することで、これらの特徴が反映されなくなります。なお入力は日本語・英語のどちらでもOKです。
- ノイズ
- 抽象的
- 表情が笑っていない
- 非対称
ネガティブという言葉を聞くと、マイナスなイメージになりやすいですが、Stable diffusionでのネガティブプロンプトは、さらに画像生成の精度を上げるための重要な技術なのです。
ネガティブプロンプトは通常のプロンプトとは別の枠に入力する場合が多く、Stable diffusionを利用するサービスによって入力場所は変わります。例えばDream Studio上から利用する場合は上記のように、画面左側に『Prompt』すなわちプロンプトの入力欄と、『Negative Prompt』すなわちネガティブプロンプトの入力欄が用意されています。
Stable diffusionで画像生成をするにあたって、通常のプロンプトで生成後の大枠を伝えるとともに、ネガティブプロントを活用することで、自分の想定からズレる可能性を減らし、より高品質な画像を生成できる可能性を上げることができます。
第2章 すぐに使える!基本ネガティブプロンプトの紹介
ここからは、様々な種類のネガティブプロンプトを紹介していきます。
① 低品質な画像を防ぐネガティブプロンプト
- low quality-品質が低い
- worst quality-最悪の品質
- out of focus-ピントが合っていない
- ugly-酷い
- blurry-ぼやけた
- overexposed – 露出過多
- underexposed – 露出不足
- distorted – 歪んでいる
- washed out – 色褪せた
- over-sharpened – シャープすぎる
- grainy – 粒子状の/ノイズが多い
② 顔の特徴・体の形状の誤差を防ぐネガティブプロンプト
- Mismatched Eyes – 調和していない目
- Distorted Nose – 歪んだ鼻
- Irregular Ears – 不規則な耳
- Uneven Teeth – 不揃いの歯
- Oversized Head – 頭部が大きすぎる
- Twisted Posture – 曲がった姿勢
- Misshapen Feet – 形がおかしい足
- Disproportionate Body – 体のプロポーションがおかしい
- bad anatomy-人体の形状・構造が不正確
- deformed mutated disfigured-変形している
- bad hands-手の形が不自然または不正確
- extra digit-通常より多い数の指がある
- ugly face-容姿が醜い顔
- deformed eyes-目が歪んでいる
- Bad Anatomy -人体の不正確な構造
③ デザインやスタイルに関するネガティブプロンプト
- oil painting-油彩の絵画技法
- Fractured Design-壊れたデザイン
- Outdated Styles-時代遅れのスタイル
- Clashing Patterns-衝突する模様
- Irregular Patterns-不規則なパターン
- Stereotypical Imagery-ステレオタイプなイメージ
- Abstract – 抽象
- Realistic – リアル
- Cubism – キュビズム
- Impressionistic – 印象派
- Anime Style – アニメ風
- Minimalism – ミニマリズム
- sketch-スケッチ風
- watercolor-水彩画
④ 色やテクスチャに関するネガティブプロンプト
- Overly Bright Colors (過度に明るい色合い)
- Washed-out Palette (色が薄れている)
- Stretched Textures (伸びたテクスチャ)
- Dull Tones (くすんだトーン)
- Too Thin Lines (線が細すぎる)
- Faint Lines (薄い線)
- Harsh Shadows (過度に濃い影)
⑤ 特定の表情を避けるネガティブプロンプト
- half-open eyes-半開きの目
- open mouth-口を開けた
- closed mouth-口を閉じた
- mascara-マスカラ
- make-up-メイクアップ
⑥バランスと構成の問題を避けるネガティブプロンプト
- Lack of Symmetry (対称性の欠如)
- Misaligned Elements (要素の位置が合っていない)
- Imbalanced Composition (バランスの取れていない構成)
- Confusing Layout (わかりにくいレイアウト)
- Lopsided Balance (片寄ったバランス)
- Crowded Composition (混雑した構成)
- Random Placement (ランダムな配置)
複数の指示をしたい場合は、カンマで区切って入力をします。
例えば
「text,signature,watermark,username,artist name,stamp,title,subtitle,date」
と入力をするとこれらを画像から除去するということになります。
ネガティブプロンプトとしてこれらの言葉で指示されたことを「生成しない」ということで高品質な画像を生成することができます。
第3章 Stable diffusion ネガティブプロンプトの注意点
より精度の高い画像を生成したいのであれば、ネガティブプロンプトでの指示を明確にする必要があります。ただし、その指示が過剰になってしまうと、AI側の処理が煩雑になり、精度が高くなるどころか、指示した画像と異なる画像になってしまうこともあります。
例えば「雲がない、背景に人がいない、色味が暗くない、動物が写っていない、家が写っていない」など「ない、ない、ない」が多くなりすぎると、何も写っていない画像が生成してしまうこともあります。
まずプロンプトで大枠の指示を入力して、その中で除外したいものがあるかどうかを確認してください。その上で過剰にネガティブプロンプトで指示をしないということに留意しましょう。
第4章 まとめ
ネガティブプロンプトの有無で、生成される画像の精度が大きく変わってきます。
まずはプロンプトで大枠の指示を入力してから、画像を確認した上でネガティブプロンプトを利用してイメージと異なる部分を修正していけば、より自分のイメージに近い画像を生成することができます。除外したいものをどう入力すればわからない場合は、コピペできる汎用例をネットで検索するのも良いでしょう。
「ネガティブプロンプト」は、使いこなせば自由自在に画像が生成できる便利なテクニック。ぜひ一度利用してみることをお勧めします。
この記事は役に立ちましたか?
もし参考になりましたら、下記のボタンで教えてください。
コメント