ChatGPTを開発したOpenAIより2023/9/20に画像生成AI『DALL-E3』が発表されました!(リンク)
また、11月6日のDevdayよりChatGPT上でのDALL-E3の使用方法が変更されたので紹介します。
今回発表された『DALL-E3』は『DALL-E2』の機能がアップデートされたものとなります。
この記事では、『DALL-E3』の使い方や、実用例、『DALL-E2』との違いや、まだ使えない方がいる理由などについて詳しく紹介しています。
第1章『DALL-E3』の特徴と『DALL-E2』との違い
『DALL-E3』はOpenAIより開発された画像生成AIであり、文章を元に画像を生成することができます。
『DALL-E2』との違いからその特徴を解説していきます。
使い方の違い
前のバージョンである『DALL-E2』との大きな違いは、その利用方法にあります。
DALL-E2は専用のwebサイト上で利用するという形式でした。(DALL-E2はこちら)
しかし、『DALL-E3』は専用のwebサイトではなく、ChatGPT上や、Microsoft Bing Image Creator上、BingAI上からの利用、すなわち別のサービス上からの利用が基本となります。
どのように利用するのかが大きな違いとなっています。
(ただし専用サイト上での利用も今後解禁されるようです。)
性能の違い
では、性能面ではどのように変化したのでしょうか?
OpenAIの公式ドキュメントに以下のような記載があります。(Google翻訳後)
現代のテキストから画像へのシステムは単語や説明を無視する傾向があり、ユーザーは迅速なエンジニアリングを学ぶ必要があります。DALL・E 3 は、提供されたテキストに正確に準拠した画像を生成する能力の飛躍的な進歩を表しています。 出典:OpenAI公式ドキュメント
つまり、こちらが入力したプロンプト(呪文)を正確に再現する能力が上がったようです。
実際に以下のプロンプト(呪文)を用いて『DALL-E3』と『DALL-E2』でどのように違いがあるのか比較してみました。
PROMPTサイボーグの猫。その右目は青く光るデジタルな目、左足は機械製。背景には未来都市の夜景。
『DALL-E2』の生成した画像は以下となります。
『DALL-E3』の生成した画像は以下となります。
画像のテイストはかなり違いますが、プロンプト再現性という意味では、『DALL-E2』では右目がデジタルかつ左足が機械製という条件を満たせている画像がないですが、『DALL-E3』の方は正確に再現できていますね。
上記より、『DALL-E3』ではプロンプト(呪文)を正確に再現する能力に大きな改善が見られたと言えそうです。
第2章『DALL-E3』の使い方
では具体的な『DALL-E3』の使い方を紹介していきます。
前述の通り、『DALL-E3』はChatGPT上、もしくはMicrosoft Bing Image Creator上およびBingAI上から使用することができるためそれぞれ分けて紹介します。
ChatGPT上での『DALL-E3』の使い方(アップデート前)
以下にDALL-E3の使い方を解説します。ただし③については11/7のOpenAIのDev dayで発表されたアップデートがまだ来ていない方に限ります。
①ChatGPTにログインします。(リンク)
②ChatGPTの有料版(ChatGPT Plus)に登録します。
ChatGPT Plusは月額20ドルとなっています。ChatGPT上での『DALL-E3』はこの有料プラン限定での利用となっているためご注意ください。
Microsoft Bing Image Creator上であれば無料で利用できるため、無料で使用したい場合はそちらをお勧めします。
③DALL-E3を選択します。
ChatGPT Plusを開くと上記のように、GPT4の機能選択画面の中にDALL-E3が追加されます!
④生成したい画像のプロンプトを入力します
ChatGPTとのチャット欄に生成したい画像の特徴を表した文章(プロンプト)を入力して送信することで、その文章を元にして画像生成が開始されます。
4枚が同時に生成されるので、好みの画像を選択して保存しましょう。
以上がアップデート前の『DALL-E3』上での画像生成の方法となります。
ChatGPT上での『DALL-E3』の使い方(アップデート後)
既に11/7のChatGPTのアップデートが来ている方は③以降が変更されているので解説します。
③GPT Exploreを開きます。
画面左上に『Explore』というボタンが追加されているのでクリックします。
④『DALL・E』を選択
画像のようにアップデート後はDALL-Eのような機能がそれぞれ個別のチャットボットとして利用できるようになります。
この中から『DALL-E』を選択しましょう。
これ以降はアップデート前と同じとなります!
また、GPTをカスタマイズできる新機能「GPTs」においてもDALL-E3の機能は利用可能です。
「DALL-E3」の機能をGPTsに盛り込むことで、「ロゴ制作に特化したGPT」などの作成が可能となります。
「GPTs」について詳しくはこちらの記事をご覧ください。
Bing Image Creator上での『DALL-E3』の使い方
①Microsoft Bing Image Creatorを開く(リンク)
②プロンプトを入力し、『参加して作成』をクリック
③Microsoftのアカウントでログイン
④『DALL-E3』による画像生成が実行
ログインが完了すると上記の画面に遷移し、自動で画像生成が開始します。
回数に制限はあるもののChatGPTと異なり、Microsoft Bing Image Creatorでは無料で『DALL-E3』が利用できるのが強みですね。
ただ、商用利用は禁止されているので、その点はご注意ください。
Microsoft Bing Image Creator上でのDALL-E3の利用方法については以下の記事で詳しく紹介しているので併せてお読みください。
サイトを表示DALL-E3導入!『Bing Image Creator』の使い方や商用利用の有無を紹介!
Bing AI上での『DALL-E3』の使い方
DALL-E3の画像生成機能はBingAIとのチャットでも利用できます。
①Microsoft Bingを開く(リンク)
②画面上部の『チャット』をクリック
『チャット』をクリックすると以下の画面となります。
③画像生成のプロンプトを入力
チャット欄に『DALL-E3』を使って生成したい画像について入力してください。
ただし、語尾に『〜な画像を生成してください』のように画像生成を要求する文章だとわかるように入力しないと画像生成の指示として認識されないので注意してください。
ChatGPTとの違いはやはり、無料である点と商用利用できない点になります。
以上の3つの方法で『DALL-E3』は利用可能ですのでぜひお好きな方法をお試しください!
第3章 『DALL-E3』の呪文と使用例
では、『DALL-E3』をどのように使えば良い画像が生成できるのかについて、実際に生成した画像の例を紹介しながら解説していきます。
プロンプト(呪文)の作成方法
『DALL-E3』をはじめとする画像生成AIを用いて生成した画像の良し悪しの大部分はこちらが入力する文章、すなわちプロンプト(呪文)がどこまで作り込まれているかに依存します。
プロのAI絵師の方などは、プロンプトを極めるとともに、様々なパラメータの調整なども行なっています。
ただ、画像を生成するたびにプロンプトを作り込むのはなかなか時間がかかるため、日常的に使用するには負担が大きいです。
そこでChatGPTを用いてプロンプトを作成する方法をお勧めします!
方法は簡単!以下の()に生成したい画像の簡単な特徴を入力してChatGPTに送信するだけです!
あなたはプロのAI絵師です。()に関する画像を生成するためのプロンプトを5つ提案してください。ただし英語で出力してください。
英語で出力する理由は、DALL-Eシリーズの性能が日本語のプロンプトよりも英語のプロンプトの方が性能が高い傾向があるからです。
上記のように英語でのプロンプトを5つ提案してくれました。
このうち一番上のプロンプトを元に『DALL-E3』を用いて画像生成した結果が以下となります。
とんでもない性能ですね…かなり衝撃的です。
プロンプト(呪文)作成プラグインについて
また、さらにクオリティを求める場合に使用できるのが、プロンプトの作成に特化したChatGPTのプラグイン『Photorealistic』です。
プラグインはChatGPT Plus(有料プラン)でのみ利用できる機能ですが、DALL-E3をChatGPT上で利用する場合も有料プランに加入する必要があるため問題ないでしょう。
プラグインの詳しい利用方法については以下の記事をご覧ください。
こちらのプラグインは画像生成AIのプロンプトの生成に特化したプラグインなので、『DALL-E3』との相性も最高です!
このように、画像生成のためのパラメータや縦横比なども詳しく指定してくれます。
上の方のプロンプトを元に、『DALL-E3』を用いて生成した画像が以下となります。
上記のようにプロンプトが詳細な分、生成される画像もかなり似た4枚となりました。
バリエーションが欲しい場合は通常のChatGPT、より詳細に指定したい場合はPhotorealisticを利用すると良いでしょう!
第4章 『DALL-E3』の注意点と今後
リリースして間もない『DALL-E3』ですが、現時点での注意点としては以下が挙げられます。
『DALL-E3』の注意点
①まだ利用できないユーザーも多い
OpenAIによって9月20日に発表された『DALL-E3』ですが、まだ順次解禁している段階であり、一部ユーザーはChatGPT上からはまだ利用できない状態となっています。
ただし、Bing上では全ユーザー利用可能なため、ChatGPT上でまだ使えない方はまずは、Bing上で使用すると良いでしょう。
②ChatGPT上で使用する場合は有料
前述の通り、ChatGPT上で使用する場合は、ChatGPT Plusに加入する必要があり、月額20ドルが必要となります。
ChatGPT Plusに加入することで利用できる機能は『DALL-E3』に留まらず、プラグインやCode Interpreter、GPT-4Vなど様々で、それぞれかなり有用な機能のため基本的には加入をお勧めします。
無料版と有料版の比較は以下の記事を参照ください。
ChatGPT Plus(有料版)とGPT3.5(無料版)の違いは?有料版の料金とメリットをご紹介!
③Bing AI上や Bing Image Creator上で使用する場合は商用利用不可
Bing AIやBing Image Creator上で『DALL-E3』を利用する場合は、無料で使える代わりに商用利用が不可となっています。
そのためこれらのサービス上で作成した画像を販売するといった行為は避けましょう。
詳しくは利用規約をご覧ください
『DALL-E3』の今後
『DALL-E3』の今後についてOpenAIの公式ドキュメント上に以下のような記載があります。
DALL・E 3 は現在リサーチプレビュー段階にあり、ChatGPT Plus と Enterprise の顧客は 10 月に API 経由で、そして今秋後半にはLabsで利用できるようになる予定です 。 引用:OpenAI 公式ドキュメント
Labsというのは現在のDALL-E2を利用するwebサイトのことですので、11月あたりには専用サイト上からの利用も解禁されるようです。
また、まだ未解禁のユーザーにも10月中には解禁されるとのことです。
第5章 まとめ
今回はOpenAIの最新画像生成AI『DALL-E3』について紹介しました。
『DALL-E3』が以前のバージョンに比べて格段に性能が上がっており、非常に使い勝手が良いことがお分かり頂けたかと思います。
また、様々なサービス上からでも利用できる点も魅力ですね!
まだ、ChatGPTから利用できない方もいるかとは思いますが、10月中には解禁されるとのことなので気長に待ちましょう!
執筆者:河津大誠
「生成AIツールを導入して業務を効率化したいが、コストを抑える方法や適切なツールの選択がわからない」とお悩みの方は、お気軽に以下よりお問い合わせください。業務内容の分析から最適なツールの提案、導入のサポートまで、全面的にサポートいたします!
また、AIツールの掲載も無料で承っておりますので、お気軽にご連絡ください!
この記事は役に立ちましたか?
もし参考になりましたら、下記のボタンで教えてください。
コメント