ChatGPTの文字数制限とは?入力・出力できるトークン数と解決策を紹介

ChatGPTには文字数制限があることをご存知でしょうか?

この文字数制限というのは質問を入力する際の制限と、ChatGPTからの回答の制限があります。この記事ではこれらの文字数制限について対処法なども踏まえて解説していきます。

ChatGPTについてはこちらで詳しく紹介しています。

生成AIハッカソンの詳細情報

第1章 何文字から文字数制限がかかるのか?

結論から言いますと、入力の場合は日本語で3300文字程度 英語なら10000文字ほど、出力の場合はほぼ制限無しとなっています。

数値が曖昧な値になっている理由は主に二つあります。

①ChatGPT側が『文字数』を認識できず、『トークン数』で理解しているから

ChatGPTの開発元であるOpenAIが公表していないから

という理由です。

トークン数とは

①の『トークン数』について解説します。

ChatGPTは私たちが普段使う言語をそのまま認識しているのではなく、トークンに置き換えて認識しています。このトークンは日本語1文字に1トークンという単純な対応関係ではなく、ひらがな1文字=1-2トークン 漢字1文字=1-3トークンというように文字の種類によって異なってくるのです。

そのため入力制限となる正確な上限文字数は出せず、おおよそでしかわからないのです。

ただし、トークン数の計測自体はOpenAIが出している『Tokenizer』を使用することで計測可能です。(リンク)

ChatGPTの回答

②についてですが、OpenAIは公表していませんが、ChatGPTに聞くと回答はしてくれます。

ChatGPTへの入力時の最大トークン数はいくつ?という質問に対するChatGPT4の回答

GPT4モデルによる回答 画像出典:ChatGPT

ChatGPTへの入力時の最大トークン数はいくつ?という質問に対するChatGPT4の回答

GPT3.5モデルの回答 画像出典:ChatGPT

GPT4とGPT3.5どちらの回答も2048トークンとのことでした。

ただし実際には3000字以上でも回答はしてくれます。ただし回答精度に不安が残るということでしょうか。

ChatGPTの回答に文字数制限はない?

出力の際にほぼ制限がない理由についてですが、これは、アップデートによって追加された新機能によるものです。

以前までは、一定の文字数で回答が中断されていました。

「日本の歴史について10000字以上で説明して」というクエリに対するChatGPTの回答

画像出典:ChatGPT

「日本の歴史について10000字以上で説明して」というクエリに対するChatGPTの回答 part2

画像出典:ChatGPT

現在でもあまり長い文章だと中断されるのですが、その際に右下に『Continue generating』というボタンが表示されるようになりました。このボタンをクリックすればそのまま回答を継続してくれるので、実質制限なく回答を継続してもらうことが可能となりました。



第2章 なぜ文字数制限がかかる?対処法は?

ではなぜ、このような文字数制限が存在するのか、それ以上の文字数を送信したい場合はどのようにすれば良いのかについてこの章では解説していきます。

なぜ文字数制限が設定されているのか?

文字数制限がある理由を聞いた

画像出典:ChatGPT

ChatGPTの回答を元にすると主に3つの理由があると言えます。

あまりに大きい情報を一度に与えられ動作に悪影響を及ぼすのを避けるため(リソース制約)

長文を処理にリソースを割くことによる回答精度の低下を抑えたいようです。

スパムなどで、同時に大量の文章を送られるなどの悪意のある攻撃に対応する意味も含まれていそうです。

ChatGPTが質問文全体の情報を読み込めない可能性がある(コンテキスト制御)(トレーニングデータの限界)

あまりに長い文章だと全体の文脈をChatGPTが読み取れない可能性があるようです。

長すぎる文章だと会話として成立しない(人間らしい対話の維持)

ChatGPTは会話型AIであるので、あまりに長い文章ではその趣旨から外れてしまうのかもしれません。

上記の理由によりChatGPTには文字数制限が存在するようです。

制限されている文字数以上の質問文を送る方法

①複数に分割して送信する

複数に分割したら意味ないじゃん!と思われるかもしれませんが、結局、全文を踏まえて回答してくれれば良いのであれば以下の方法を用いれば可能です。

まず、ルールを設定します。例えば、

PROMPT次に『要約して』と入力するまでは回答を生成せず、『待機中』とだけ出力してください

とすることで全文入力するまで待たせることが可能です。『要約して』の部分はその際にChatGPTに要求したい作業に合わせると良いでしょう。

次に『要約して』と入力するまでは回答を生成せず、『待機中』とだけ出力してくださいというルールをChatGPTに伝えている

画像出典:ChatGPT

次に『要約して』と入力するまでは回答を生成せず、『待機中』とだけ出力してくださいというルールのもとにChatGPTが待機している様子

画像出典:ChatGPT

上記のように全文を送り終えるまで待機してくれます。この方法でひとまず、文字数上限は突破可能です。

ただし、あまりに長い文章ではChatGPTが記憶を保持できず、ルールを守らなくなる場合があります。その際は次に紹介する方法を用いてください。

②PDF化して読み込ませる(Ask Your PDF/Cord Interpreter)

文章が長すぎる場合は一度PDFとして保存してからChatGPTに読み込ませる方法がおすすめです。

ChatGPTにPDFを読み込ませる方法としてはプラグインの一つである『Ask Your PDF』を用いる方法と、新機能である『Cord Interpreter』を用いる方法の2つがあります。(ただしどちらも有料プランであるChatGPT Plusユーザー限定の機能となります。)

PluginsとCode Interpreterの画面

GPT4の機能としてどちらも使用できます。画像出典:ChatGPT

Ask Your PDF』を用いる場合はまずプラグインStoreにて『Ask Your PDF』をインストールします。

Plugin Storeのホーム画面

画像出典:ChatGPT

基本的にストアを開いた最初の画面に存在します。(ない場合は『Search Plugins』から検索しましょう。)

『Install』をクリックすると利用可能となるので、読み込ませたいPDFのURLを送信しましょう。

URLがない場合でも利用は可能です。詳しくは以下の記事をご覧ください。

ChatGPT『Ask Your PDF』使い方をご紹介!- PDFの内容を爆速で理解しよう!

『Cord Interpreter』を用いる場合はアップロードのみで問題ないです。

ただし、現時点ではエラーが発生する場合もありますので、その場合は『Ask Your PDF』などのプラグインを利用しましょう。

③GPT4-Turboを利用する

11/7に発表されたアップデートで登場したGPT4-Turboを利用するとトークン数の制限を増やすことができます。

GPT4-Turbo最大トークン数が128,000トークンに拡大されており、日本語でも60000字までの入力が可能と、大幅にトークン数が増加しています。

ただし、GPT4-TurboはAPI経由でしか利用できないため、通常のChatGPTとは別物である点には注意してください。

ChatGPT APIについて詳しくはこちら!



第3章 まとめ

今回はChatGPTの文字数制限とその対処法を紹介しました。

文字数制限に関しては現状は日本語で3300文字程度、英語で10000文字ほどとなっています。

入力の文字数制限は要約などに利用する場合は不便に感じることもあるかと思いますが、今回紹介したルールを設定する方法かPDFを読み込ませる方法を使って対処しましょう!

執筆者:河津大誠

 

 

この記事は役に立ちましたか?

もし参考になりましたら、下記のボタンで教えてください。

関連記事

コメント

この記事へのコメントはありません。