ChatGPTの音声機能advanced voiceモードが登場!使い方や料金・APIの有無について詳しく紹介!

画像出典 OpenAI

ついにAIと会話できる時代が来ました!2024年9月25日についにChatGPTから高性能の音声機能、「advanced voiceモード」が登場しました!

リアルタイムでの音声による応答を可能にしたことで、ChatGPTと会話をするかのようなスピード感でやり取りができます。今回は、「advanced voiceモード」の詳細について詳しく紹介します!

1章 advanced voiceモードの機能概要とアップデート内容

2024年9月25日、OpenAIのChatGPTを待ち望んだ「advanced voiceモード」が登場しました。この新機能により、ユーザーはスマートフォンやパソコンを使って音声でChatGPTと会話できるようになります。特に、音声での会話をさらに向上させるために、最新のモデルである「GPT-4o」が採用して、より自然で瞬時の対話ができるようになっています。

新機能の主なアップデートポイントは、以下の通りとなります。

  • 自然な会話: 音声入力を超え、より会話に近いインタラクションを実現。ユーザーが音声で質問すると、ChatGPT が即座に音声で応答します。

  • 選択可能な音声の種類: 従来の5~6種類から9種類に増加し、個性豊かな音声を選ぶことができます。など、シーンに合わせて選択可能です。

  • バックグラウンドでの会話機能: 他のアプリを使用中やスマホの画面がロックされている状態でも会話を継続できるため、通勤中や作業中でもAIと対話が可能です。

  • データの扱い: 音声クリップはチャット履歴に保存され、削除されるまで最大30日間保持されます。そのため、保存された会話を後から確認したり、リプライを行うことができます。

  • 会話の途中での割り込み

    また、会話中にAIが話している最中でも、人間側が割り込んで話し始めることが可能になりました。AIが話中断してこちらの話を聞いてくれて、話が終わると即座に反応しこれにより、自然な会話の流れを継続しつつ対話を進めることができました。

  • 利用ユーザー制限:Advanced Voice ModeはPlusプランまたはTeamプランのユーザー向けで、1日の使用時間に上限があります。

  • 速度と進行性

    特に、以前の標準音声モードと比べてレイテンシーが大幅に改善されており、ほぼ人間と会話しているかの従来の標準モードでは5.4秒ほどの視聴がありましたが、高度な音声モードでは、平均320ミリ秒、最速で232ミリ秒という驚異的な速さで応答が可能です。この速さが実現たのは、GPT-4oモデルのマルチモーダル機能を活用しているためです。

  • 音声のバリエーションと感情表現

    選択できる9種類の音声オプションにより、まるで人間と会話のような会話が楽しめます。 特に、笑い声や驚きなどの感情をこめたボイスも追加されており、これが会話の臨場感を最大限高めていますまた、音声の速度やトーンも自然に変化するため、状況に合わせて適切な反応を示す点が非常に優れています。

  • バックグラウンドでの会話と再開

    バックグラウンドでの会話機能をオンにすれば、他のアプリを使っている最中や画面をロックしている間でもChatGPTとの会話が続けられる点は、非常に便利です。音声モードでは、以前の会話スレッドで音声モードを再開することも可能になりました。これにより、前回の会話の流れを引き継いでAIとのコミュニケーションを継続できます。

2章 advanced voiceモードの使い方

advanced voiceモードの使い方を解説します。

スマホアプリの場合

①アプリの起動:

ChatGPT アプリを立ち上げましょう!

②波形アイコンをタップ

画面右下の波形のマークを示す

画像出典 Open AI

右下の波形アイコンをタップします。初回起動時に「advanced voiceモードの紹介」が表示されます。

③音声の選択:

9種類の音声から好みのものを選択します。「Arbor」や「Breeze」など、キャラクターに合わせて選ぶことができます。音声を変更する際は、画面中央の「青い月」下に表示される名前の部分を横にスライドします。

会話の開始: 音声を選択したら、会話がスタートします。左下のマイクボタンを押すとミュートが可能で、もう一度押すとマイクがオンになります。

バックグラウンドでの会話:

設定からバックグラウンドでも使えるようになる

画像出典 Open AI

アプリの設定から「バックグラウンドでの会話」をオンにすることで、他のアプリを使っても会話を継続できます。

会話の終了: 画面右下のバッテン印を押すと会話が終了します。終了後もチャット履歴にテキストとして会話が残ります。

アプリを起動して「新しいチャットを開始してAdvanced Voiceモードを使用する」をタップすることで、手動でAdvanced Voice モードにできることもできます。起動後は、画面中央に青い縁取りが表示されるので、これが起動確認の目印となります。

pc版アプリの場合

pc版での使い方も紹介します!

①pcのアプリ版ChatGPTを開く

まずは、ChatGPTのアプリを開きましょう。

②マイクマークをクリック

アプリ版でChatGPTを開く

画像出典 OpenAI

このように画面赤枠で囲まれたマイクマークをクリックしてください。

マイクの許可

画像出典 Open AI

画像のようにマイクへのアクセスを要求されるので、「許可」をクリックして次に進みましょう!

③音声の選択

音声の選択が9種類からできる

画像出典 Open AI

このようにChatGPTが話す声を選択することができます。ご覧のように新たな音声が追加されていることがわかります。

これにてChatGPTでの設定は完了ですあとは、話しかけるだけです!

3章advanced voiceモードを実際に使ってみた

高度な音声モードを実際に使ってみると、従来のものと比較して速度は段違いに向上していることがわかります。

ChatGPTと音声で会話している様子

画像出典 Open AI

こちらが実際に会話をしている様子となります。自分が話終わってから1,2秒ほどでChatGPT側からの音声があるイメージです。冒頭でお話しした数ミリ秒といったほどの速さはなかったものの精度とスピードは今までと段違いであると感じました!

自分の言った単語を英語に直してもらう

画像出典 Open AI

さらに、例えば自分が言った言葉を英語に直してもらうということもできます。これを応用すれば海外の人とChatGPTを通じて翻訳による会話ができたり、英会話教室に通わなくてもChatGPTと英会話の勉強ができたりとかなりの可能性を感じます!

4章advanced voiceモードは無料で使える?APIは?

advanced voiceモードの料金

advanced voiceモードを使うには、ChatGPTの有料プランである、Plusプランに加入する必要があります。月額20ドルとなっていますが、advanced voiceモードに加えて最高性能モデルであるGpt-4oやChatGPTo1などを使うこともできるようになります!

ChatGPT有料プランの料金表

画像出典 OpenAI

API について

API利用については、現時点では情報がありません。API利用ができれば高度な音声機能を使った面白いアプリやサービスが作れるようになること間違いなしです!今後の動きに期待しましょう。

5章 まとめ

ChatGPTの「advanced voiceモードモード」は、音声でのコミュニケーションをよりリアルで直感的なものに進化させた革新的な機能です。9種類の音声選択やバックグラウンドでの会話機能など、実際の利用シーン特に、会話の発生性や割り込み機能、感情をこめたボイスなど、まるで人間と会話のような体験を提供してくれます。

PCでChatGPTを常駐させ、AIが音声モードで常に耳を立てる未来がすぐそこまで来ていると感じさせる機能です。

音声モードの導入により、通訳や語学学習、ビジネスでのアイデア出しなど、多様なシーンでの活用が可能となり、AIとの対話の可能性が感じられますね。 ぜひこの機能を使いこなして、ChatGPTの音声モードが始まる新たなコミュニケーションの未来を体験してみてください

この記事は役に立ちましたか?

もし参考になりましたら、下記のボタンで教えてください。

関連記事