Googleの新AI Geminiが話題になっています。本サイトで「Gemini」について紹介した記事(こちらからご覧ください!)も多くの方にご覧いただいており、筆者自身も関心の高さを実感しております!
そして12月13日GeminiのAPIが公開されました。Google Bardに搭載されたGemini Proを今まで使っていましたが、 API経由でGemini Proが使えるようになります。
API経由でGemini Proが使えるのはGoogleの開発ツールである「Google AI Studio」と「Vertex AI」の二つです。
今回はGoogel AI Studioを使ったGemini APIの使い方について詳しく解説していきます。
目次
1章「Gemini API」の概要
1-1「Google AI Studio」とは
初めにGoogle AI StudioとAPIについて簡単にご紹介いたします。
まず初めに、Google AI Studioとは個人向けの開発ツールです。
APIは「Application(アプリケーション) Programming(プログラミング) Interface(インターフェース)」の略で、異なるソフトウェアやWebサービスでの情報のやり取りをつなぐインターフェースを指します。
今回の場合だとGoogle AI Studioという開発ツールがAPIという形をとってGeminiを使うことができるようになるということを意味します。
1-2「Google AI Studio」の始め方・APIキーの取得
Google AI Studioの始め方とGemini Proのセットアップ方法を説明します。
Google AI Studioの始め方
①公式サイトを開く
まずは公式サイトを開きましょう。公式サイトを開くとこのような画面が現れます。青いボタンの「Get API key in Google AI Studio」をクリックしていきましょう。この時、Google アカウントにログインした状態でこのサイトを開くことをお勧めします!
②利用規約に同意する
次の画面に進むと、Google AI Studioの利用規約に同意する画面があります。内容をしっかり読んで同意しましょう!
こちらが先ほどの利用規約を日本語訳した画面になります。
画面のようにこちらの利用規約のチェック欄を全て埋めた後、「続く」をクリックすることでGoogle AI Studioの準備は完了です!
APIキーの取得
次に、Google AI StudioからAPI キーを取得します。
画面左にはこのような画面があるので、赤枠で囲まれた「Get API Key」を選択します。
新たにAPI キーを取得する場合には「Create API key in new project」をクリックします。
これでAPI キーの取得が完了しました。取得したAPI キーは取得後もこのページに戻ってくれば確認することができます。
API キーは決して他の人に見せたり公開したりしないように気をつけましょう。
2章「Google AI Studio Gemini」の使い方
それでは早速Google AI StudioでGeminiを使う方法をご紹介いたします。
こちらがGoogle AI Studioのホーム画面になります。基本的にはこちらにプロンプトを入力することで、ChatGPT やBardと同じように使うことができます。画面は非常にシンプルで直感的な操作ができますね。
上の画像は、ホーム画面の右側の設定画面を拡大したものです。ご覧の通りGemini Proのさまざまな項目についての設定ができることがわかります。
2-1Gemini APIの設定
Model
Modelでは、通常モードの「Gemini Pro」と画像をプロンプトに組み込むことのできる「Gemini Pro Vision」の2つからモデルを選択することができます。
Temperature
Googleの公式サイトによると、Temperatureはプロンプトに対する回答のランダム度を表しているようです。この度合いが低いほど事実に基づいた回答を行い、度合いが高ければ独創的な回答を行うそうです。
そのためアイデアが欲しい場合はTemperatureの値を大きく、正確な情報を知りたい場合は値を小さくするという使い分けをすることでGeminiのポテンシャルを最大限発揮することができそうです。
Add stop sequence
これは指定した単語が表示されると回答を終了するという機能です。悪意を持ったプロンプトによって内部情報などが漏洩するプロンプトインジェクションを防ぐ効果や回答の長さを調整するためなどに使われるようです。
Safety Setting
不適切な単語を回答に入れないなどの設定ができます。
Gemini APIの使用例
早速Geminiを使っていきましょう。
プロンプトは「Googleから新たに発表された生成AIである「Gemini」の広告文を200文字で作ってみてください」というようにしました。
上の画像の青く示されている部分がプロンプトに対する回答になります。クオリティの高い文章が生成されました。
さらにGoogle AI Studioの使いやすい点として連続してプロンプトをする場合があります。
このように、2つのプロンプトを連続で行っても全て同じ1つの画面で出力がされます。
また、プロンプトや回答を自分で消したり書き加えたりすることもできます。チャット形式よりも作業をまとめて行ったりすることができたり、情報を書き留めて置けるので非常に使いやすいです!
こちらが、Gemini Pro Visionで画像付きのプロンプトをした様子です。画像の情報や画像から読み取れる雰囲気なども解説してくれています。
2-2 Gemini APIをPythonで使う方法
Gemini APIをPythonで使う方法をご紹介いたします。
Google AIの公式サイトにクイックスタートガイドがあるので、そちらに従っていきましょう。
公式サイトにアクセスして画面赤枠の「Run in Google Colab」をクリックしましょう。
クリックするとこちらのような画面が開きます。これを上から順番に実行していきましょう。
このようにしばらく進めていくと「Secret GOOGLE_API_KEY does not exist」というエラーが発生します。これは、Google Colab内の秘密鍵にAPIキーをあらかじめ設定していないことが原因です。
まずは画面左にある上の画像垢枠の鍵のマークをクリックします。こちらをクリックすると秘密鍵を設定できます。
名前を「GOOGLE_API_KEY」にして値の部分にAPIキーを入力しましょう。
このように秘密鍵を設定したことでエラーを解消することができました。その後も順番に実行を続けていきます。
このように、Google ColabでGeminiを使うことができました。
3章 Gemini APIの料金
Gemini APIは2024年初頭までの間、無料で使うことができます!
料金体系は上のようになります。有料化後は、
テキスト入力が1000文字あたり0.00025ドル、画像1枚あたり0.0025ドル、テキスト出力が1000文字あたり0.0005ドルとなります。
比較としてGPT-4の料金体系を紹介します。
Geminiの料金がかなり安いということがわかりますね。
4章まとめ
今回はGemini APIの導入方法や使い方についてご紹介しました。難しい手順は一切なくしばらくの間は無料で使うことができるので、ぜひ使ってみてください!
この記事は役に立ちましたか?
もし参考になりましたら、下記のボタンで教えてください。
コメント