Stable Diffusionとは?Web上での基本的な使い方や画像の生成例!

近年画像生成AIが注目を浴び、エンタメや医療などの様々な分野で活用されています。

有名な画像生成AIには、Midjourney、DALL-E、Stable Diffusion などがありますが、今回は画像生成AIが注目されるきっかけとなったStable Diffusionについて、その基本知識や魅力、使い方を紹介します!

第1章 Stable Diffusion とは

Stable Diffusionとは

Stable Diffusionは、2022年にイギリスのStability AI社が開発した画像生成モデルで、 テキスト(プロンプト、呪文)から画像を生成することができるAI技術です。

有料の画像生成モデルであるDALL・E2Midjourneyに対し、Stable Diffusionオープンソースで誰でも無料で利用でき、また生成した画像は商用利用できるため、世界中の企業が注目しています!

Stable Diffusionの基本的な使い方

基本的にはプロンプトに生成したい画像の特徴をテキストで入力し画像を生成するだけです。

うまくロンプト内にキーワードを含めることで生成される画像の雰囲気やディテールをコントロールすることができ、また、パラメータの調整によって画像の明るさや彩度、コントラストなどもコントロールできます。

例えば、冒頭の写真のようにリアルな人の顔を生成することもできますし、下の写真のように絵本やアニメのような写真を生成することもできます。

Dreamstudioで生成した夕焼けビーチの画像

Dreamstudioで生成した夕焼けビーチの画像

また、このようにリアルな景色のような画像も生成できます。

dreamstudioを用いて生成した夕焼けビーチの画像

dreamstudioを用いて生成した夕焼けビーチの画像

ちなみに上の二つは、Dream studio を用いて、ほとんど同じ文章(プロンプト)で命令しています。パラメータを少しカスタムすることでこんなに雰囲気の違う画像が生成できるのはすごいですね。

第2章 Dream Studio/Hugging Face/Mage Spaceの比較

Stable Diffusionの使い方

Stable Diffusion を使う方法は、[1]Web上に構築された環境を利用する方法と、[2]ローカル環境(自分のPC)にStable Diffusionをインストールし利用する方法、の主に2通りあります。

[1]Web上に構築された環境を利用する方法

Stable Diffusionを用いた画像生成AIのサービスである「Dream Studio」「Mage Space」「Hugging Face」を利用する方法です。

以下で順に具体的な使用方法を紹介しています。

[2]ローカル環境(自分のPC)にインストールし利用する方法

Python、Git、Web UIをダウンロードしStable Diffusionを使用する方法です。

少し初心者にとっては大変ですが、機能制限や枚数制限なく無料で使うことができるという点で優れています。

こちらについて詳しくは以下の記事をご覧ください。

Stable Diffusion web UIのローカルPC(windows)への導入方法と使い方!

Stable Diffusionの使用方法①:Dream Studio

Dream Studioの概要

まず紹介するのは、Dream Studioです。

Dream StudioはStability AIが開発したStable Diffusionを用いた画像生成AIサービスです。

最初に無料でクレジットが付与されデフォルトの設定で500枚の画像を生成でき、十分に遊べます。

使い方

まず、Dream Studioのページを開きます。

初めての人はSign up、アカウントを持っている人はlog inしましょう。

画像出典:Dream Studio

すると、このような画面になると思います。

大まかに3つのエリアに分けられます。

画像出典:Dream Studio

 

①のエリアでプロンプトを入力や詳細設定をした後、②の実行ボタンを押すことで、③のエリアに生成画像が表示されます。

画像を保存したいときは、画像にカーソルを合わせたときに出てくる、ダウンロードボタンを押すことで保存できます。

dreamstudioで生成された画像を保存する様子

ここで“①プロンプト入力、詳細設定”エリアのStyle、Prompt、Settingsについて説明します。

画像出典:Dream Studio

〇 Styles

ここは画像の雰囲気を決める部分です。右側 “>”をクリックするとこのような画面が出てきます。

dreamstudioのstyleを決定する画面

画像出典:Dreamstudio

Enhance, Anime, Photographicなど、全16種類の画像のスタイルが選べます。

目的の画像のイメージに近いスタイルを選びましょう。

〇 Prompt(プロンプト/指示の入力)

ここはプロンプトを入力する部分です

プロンプトとは、どのような画像を生成して欲しいか、文章で書くものになります。

尚、プロンプトは英語で書かなければなりません。

例えば、「A futuristic cityscape with many tall buildings, resembling a floating city. The scene has a blue-based color palette, with UFOs flying around. It has the feel of a wide-angle photograph.(未来的な都市景観で、多くの高層ビルがあり、浮遊都市のように見えます。シーンは青を基調としたカラーパレットで、UFOが飛び交っています。広角写真のような雰囲気があります。)」と入力するとこのような画像が生成されます。

dreamstudioで生成した浮遊都市の画像

dreamstudioで生成した浮遊都市の画像

特徴をうまくプロンプトとしてまとめられない場合や英語に翻訳したい時はChatGPTを利用するといいと思います。

例えば、今回の画像ではChat GPTにこのように聞いてみると、

画像生成AIのstable diffusionを用いて画像生成をしたいです。以下のプロンプトを日本語で改変したのちに、英語に訳してください。「近未来都市、背の高い建物がたくさんあり、浮遊都市になっている、青をベースとした色味で、UFOが飛んでいる、引きで撮った写真のような感じ」

すると、

日本語のプロンプト(改変後): 「近未来の都市で、背の高い建物がたくさん立ち並び、浮遊都市のようになっている。青をベースとした色調で、UFOが飛んでいる。引きで撮った写真のような雰囲気。」

英語のプロンプト: “A futuristic cityscape with many tall buildings, resembling a floating city. The scene has a blue-based color palette, with UFOs flying around. It has the feel of a wide-angle photograph.”

と返って来たので、この英文を使用しました。

〇 Settings

ここでは、画像の縦と横のサイズ生成する画像の枚数を決めることができます。

使う用途などに合わせて決めましょう。

有料プラン

Dream Studioでは、最初にsign upすることで無料でクレジットが貰え、これによりデフォルトの設定で500枚ほどの画像を生成することができます。

クレジットが切れると、追加でクレジットを買う必要があります。10ドルで、5000枚ほど画像を作れます。

>>今すぐDream Studioで画像を生成する。

Stable Diffusionの使用方法②:Hugging Face

Hugging Faceの概要

続いて、Hugging Faceというサービスを紹介します。

Hugging FaceはHugging Face社が提供するAIのモデルや機械学習の学習用のデータセットが公開されたプラットフォームです。

sign upなし、無料で使用できます。

使い方

まずサイトを開きます。

Hugging faceのデフォルト画面

画像出典:Hugging face

“Enter your prompt”にプロンプトを打ち込み、”Generate image”を押すだけで画像を生成できます。

>>今すぐHugging Faceで画像を生成する。

Stable Diffusionの使用方法③:mage.space

mage.spaceの概要

最後にmage.spaceというサービスについて紹介します。

mage.spaceはOllano社が運営する画像生成サービスで、無料で、sign upなしに画像生成することができます。(有料プランもある。)

使い方

まずmage.spaceを開きます。サイトを開いたらプロンプトを打ち込み、右側の”→”を押すだけ!

さらに、本格的に作りたいという方は、Hide Modelsを押します。

さらにmodelsを押すと、

mage.spaceのカスタム画面

画像出典:mage.space

settingsをクリックと、

画像出典:mage.space

これらの画面でモデルの選択やパラメータを操作できます。

aspect ratioでは縦と横の長さの比、stepでは画像が生成されるまでの工程の数、guidance scaleではどの程度プロンプトが影響するのか、を指定できます。

有料プラン

Dream Studioでは、クレジットを買うことでたくさんの画像を生成できるということでしたが、mage spaceはサブスクリプションサービスになっています。

mage.spaceの料金プラン

画像出典:mage.space

写真はgoogle chromeで和訳してあります。

月額15ドルを払うことで、モデルが使い放題になったり、広告がなくなったりします。

より良い画像が作りたかったらプロプランに入ってねという感じでしょうか。

>>今すぐmage.spaceで画像を生成する。

Dream Studio, Hugging Face, mage.spaceの比較!

Dream Studio、Hugging Face、mage.spaseを3つの視点から比較したいと思います!

Dream Studio/Hugging Face/Mage Spaceを比較した表

ここで、どんな人にどれがおすすめかを、筆者の主観でお伝えしたいと思います!

画像を一番簡単に生成してみたい!Hugging Face

質の高い画像を生成したい!Dream Studio、mage.space

Dream StudioとMage spaceでは有料プランに違いがあるので、その辺りを気をつければあとは使いやすい方を使うのがいいかなと思います。

第3章 Stable Diffusionで画像を生成してみよう!

今回はmage.spaceで画像を生成していきたいと思います。

まずはシンプルなプロンプトで生成してみましょう!

“森でギターを弾く犬”を生成してみます。

PROMPTdog playing guitar in the forest

続いて”近未来都市”とだけ入力すると

PROMPTnear future city

near future cityで生成した画像

今度は近未来都市に色々指定した画像を生成してみます。

“リアルな画風でスタイリッシュな車が空を飛び、歩道ではヒト型ロボットが歩き、無機質なビルが立ち並ぶ近未来都市”

PROMPTA futuristic city where stylish cars fly, humanoid robots walk on the sidewalks, and inorganic buildings line the streets in a realistic style.

A futuristic city where stylish cars fly, humanoid robots walk on the sidewalks, and inorganic buildings line the streets in a realistic style.で生成した画像

画風や画像内に入れたいものの名前などを具体的に記述すると、目的の画像に近づきます!

PROMPTBeautiful woman reading a book in a luxurious room in realistic painting style

Beautiful woman reading a book in a luxurious room in realistic painting styleで生成した画像

PROMPTgraphic design t-shirt, flat design , car, Miami street, colorful hues, highly detailed clean, vector image, photorealistic masterpiece, professional photography, realistic car, simple sunrise background for the car, flat black background, isometric, bright vector((black background))

mage.spaceで生成したおしゃれな車の画像

目的の画像に近づけるにはプロンプトが非常に重要です。

この記事は役に立ちましたか?

もし参考になりましたら、下記のボタンで教えてください。

関連記事

コメント

この記事へのコメントはありません。