近年画像生成AIが注目を浴び、エンタメや医療などの様々な分野で活用されています。
有名な画像生成AIには、Midjourney、DALL-E、Stable Diffusion などがありますが、今回は画像生成AIが注目されるきっかけとなったStable Diffusionについて、その基本知識や魅力、使い方を紹介します!
目次
第1章 Stable Diffusion とは
Stable Diffusionとは
Stable Diffusionは、2022年にイギリスのStability AI社が開発した画像生成モデルで、 テキスト(プロンプト、呪文)から画像を生成することができるAI技術です。
有料の画像生成モデルであるDALL・E2やMidjourneyに対し、Stable Diffusionはオープンソースで誰でも無料で利用でき、また生成した画像は商用利用できるため、世界中の企業が注目しています!
Stable Diffusionの基本的な使い方
基本的にはプロンプトに生成したい画像の特徴をテキストで入力し画像を生成するだけです。
うまくプロンプト内にキーワードを含めることで生成される画像の雰囲気やディテールをコントロールすることができ、また、パラメータの調整によって画像の明るさや彩度、コントラストなどもコントロールできます。
例えば、冒頭の写真のようにリアルな人の顔を生成することもできますし、下の写真のように絵本やアニメのような写真を生成することもできます。
また、このようにリアルな景色のような画像も生成できます。
ちなみに上の二つは、Dream studio を用いて、ほとんど同じ文章(プロンプト)で命令しています。パラメータを少しカスタムすることでこんなに雰囲気の違う画像が生成できるのはすごいですね。
第2章 Dream Studio/Hugging Face/Mage Spaceの比較
Stable Diffusionの使い方
Stable Diffusion を使う方法は、[1]Web上に構築された環境を利用する方法と、[2]ローカル環境(自分のPC)にStable Diffusionをインストールし利用する方法、の主に2通りあります。
[1]Web上に構築された環境を利用する方法
Stable Diffusionを用いた画像生成AIのサービスである「Dream Studio」「Mage Space」「Hugging Face」を利用する方法です。
以下で順に具体的な使用方法を紹介しています。
[2]ローカル環境(自分のPC)にインストールし利用する方法
Python、Git、Web UIをダウンロードしStable Diffusionを使用する方法です。
少し初心者にとっては大変ですが、機能制限や枚数制限なく無料で使うことができるという点で優れています。
こちらについて詳しくは以下の記事をご覧ください。
Stable Diffusion web UIのローカルPC(windows)への導入方法と使い方!
Stable Diffusionの使用方法①:Dream Studio
Dream Studioの概要
まず紹介するのは、Dream Studioです。
Dream StudioはStability AIが開発したStable Diffusionを用いた画像生成AIサービスです。
最初に無料でクレジットが付与されデフォルトの設定で500枚の画像を生成でき、十分に遊べます。
使い方
まず、Dream Studioのページを開きます。
初めての人はSign up、アカウントを持っている人はlog inしましょう。
すると、このような画面になると思います。
大まかに3つのエリアに分けられます。
①のエリアでプロンプトを入力や詳細設定をした後、②の実行ボタンを押すことで、③のエリアに生成画像が表示されます。
画像を保存したいときは、画像にカーソルを合わせたときに出てくる、ダウンロードボタンを押すことで保存できます。
ここで“①プロンプト入力、詳細設定”エリアのStyle、Prompt、Settingsについて説明します。
〇 Styles
ここは画像の雰囲気を決める部分です。右側 “>”をクリックするとこのような画面が出てきます。
Enhance, Anime, Photographicなど、全16種類の画像のスタイルが選べます。
目的の画像のイメージに近いスタイルを選びましょう。
〇 Prompt(プロンプト/指示の入力)
ここはプロンプトを入力する部分です。
プロンプトとは、どのような画像を生成して欲しいか、文章で書くものになります。
尚、プロンプトは英語で書かなければなりません。
例えば、「A futuristic cityscape with many tall buildings, resembling a floating city. The scene has a blue-based color palette, with UFOs flying around. It has the feel of a wide-angle photograph.(未来的な都市景観で、多くの高層ビルがあり、浮遊都市のように見えます。シーンは青を基調としたカラーパレットで、UFOが飛び交っています。広角写真のような雰囲気があります。)」と入力するとこのような画像が生成されます。
特徴をうまくプロンプトとしてまとめられない場合や英語に翻訳したい時はChatGPTを利用するといいと思います。
例えば、今回の画像ではChat GPTにこのように聞いてみると、
「画像生成AIのstable diffusionを用いて画像生成をしたいです。以下のプロンプトを日本語で改変したのちに、英語に訳してください。「近未来都市、背の高い建物がたくさんあり、浮遊都市になっている、青をベースとした色味で、UFOが飛んでいる、引きで撮った写真のような感じ」」
すると、
「日本語のプロンプト(改変後): 「近未来の都市で、背の高い建物がたくさん立ち並び、浮遊都市のようになっている。青をベースとした色調で、UFOが飛んでいる。引きで撮った写真のような雰囲気。」
英語のプロンプト: “A futuristic cityscape with many tall buildings, resembling a floating city. The scene has a blue-based color palette, with UFOs flying around. It has the feel of a wide-angle photograph.”」
〇 Settings
ここでは、画像の縦と横のサイズ、生成する画像の枚数を決めることができます。
使う用途などに合わせて決めましょう。
有料プラン
Dream Studioでは、最初にsign upすることで無料でクレジットが貰え、これによりデフォルトの設定で500枚ほどの画像を生成することができます。
クレジットが切れると、追加でクレジットを買う必要があります。10ドルで、5000枚ほど画像を作れます。
>>今すぐDream Studioで画像を生成する。
Stable Diffusionの使用方法②:Hugging Face
Hugging Faceの概要
続いて、Hugging Faceというサービスを紹介します。
Hugging FaceはHugging Face社が提供するAIのモデルや機械学習の学習用のデータセットが公開されたプラットフォームです。
sign upなし、無料で使用できます。
使い方
まずサイトを開きます。
“Enter your prompt”にプロンプトを打ち込み、”Generate image”を押すだけで画像を生成できます。
>>今すぐHugging Faceで画像を生成する。
Stable Diffusionの使用方法③:mage.space
mage.spaceの概要
最後にmage.spaceというサービスについて紹介します。
mage.spaceはOllano社が運営する画像生成サービスで、無料で、sign upなしに画像生成することができます。(有料プランもある。)
使い方
まずmage.spaceを開きます。サイトを開いたらプロンプトを打ち込み、右側の”→”を押すだけ!
さらに、本格的に作りたいという方は、Hide Modelsを押します。
さらにmodelsを押すと、
settingsをクリックと、
これらの画面でモデルの選択やパラメータを操作できます。
aspect ratioでは縦と横の長さの比、stepでは画像が生成されるまでの工程の数、guidance scaleではどの程度プロンプトが影響するのか、を指定できます。
有料プラン
Dream Studioでは、クレジットを買うことでたくさんの画像を生成できるということでしたが、mage spaceはサブスクリプションサービスになっています。
写真はgoogle chromeで和訳してあります。
月額15ドルを払うことで、モデルが使い放題になったり、広告がなくなったりします。
より良い画像が作りたかったらプロプランに入ってねという感じでしょうか。
>>今すぐmage.spaceで画像を生成する。
Dream Studio, Hugging Face, mage.spaceの比較!
Dream Studio、Hugging Face、mage.spaseを3つの視点から比較したいと思います!
ここで、どんな人にどれがおすすめかを、筆者の主観でお伝えしたいと思います!
画像を一番簡単に生成してみたい!→ Hugging Face
質の高い画像を生成したい!→ Dream Studio、mage.space
Dream StudioとMage spaceでは有料プランに違いがあるので、その辺りを気をつければあとは使いやすい方を使うのがいいかなと思います。
第3章 Stable Diffusionで画像を生成してみよう!
今回はmage.spaceで画像を生成していきたいと思います。
まずはシンプルなプロンプトで生成してみましょう!
“森でギターを弾く犬”を生成してみます。
PROMPTdog playing guitar in the forest
続いて”近未来都市”とだけ入力すると
PROMPTnear future city
今度は近未来都市に色々指定した画像を生成してみます。
“リアルな画風でスタイリッシュな車が空を飛び、歩道ではヒト型ロボットが歩き、無機質なビルが立ち並ぶ近未来都市”
PROMPTA futuristic city where stylish cars fly, humanoid robots walk on the sidewalks, and inorganic buildings line the streets in a realistic style.
画風や画像内に入れたいものの名前などを具体的に記述すると、目的の画像に近づきます!
PROMPTBeautiful woman reading a book in a luxurious room in realistic painting style
PROMPTgraphic design t-shirt, flat design , car, Miami street, colorful hues, highly detailed clean, vector image, photorealistic masterpiece, professional photography, realistic car, simple sunrise background for the car, flat black background, isometric, bright vector((black background))
目的の画像に近づけるにはプロンプトが非常に重要です。
執筆者;きょうかのばあば きょうか
きょうかのばあば
デジタルシニア テクノロジーを使いこなす71歳のばあば👵
この記事は役に立ちましたか?
もし参考になりましたら、下記のボタンで教えてください。
コメント