ChatGPT Advanced Data Analysisでグラフを作る方法や文字化けの防ぎ方をご紹介!

昨今話題のChatGPTですが、GPT4が2023年3月、プラグインが5月、Code interpreterが7月に一般公開されるなど、短い期間で飛躍的な進化を遂げています。

そして(2023年8月23日)GPT3.5のfine tuningも可能になりました。

私たちのサイトAITechWorldではさまざまなプラグインを紹介してきたり、さまざまな実用的な生成系AIツールを紹介していますが、今回はそんな中でもChatGPT  Advanced Data Analysis(元code interpreter)を用いて、データからグラフを作る方法をご紹介します!

*Code InterPreterは8/28のアップデートで Advanced Data Analysisに名称が変更されました。

実際にみなさんのChatGPTアカウントでも再現できるように、丁寧に紹介しているので、是非ご覧ください。

生成AIハッカソンの詳細情報

 

ChatGPT Code interpreterとは?

まずは、ChatGPT  Advanced Data Analysis(Code interpreter)の使い方についてご紹介します。

Pythonコードの生成〜プログラム実行までできる

ChatGPT  Advanced Data Analysis(Code interpreter)は、「こういうプログラムを実行したい!」ということをChatGPTに説明してあげるだけでPythonのコード生成〜プログラムの実行までしてくれるツールです。

また、ファイルをアップロードして、その情報を踏まえてChatGPTを行うことも可能です。

プログラムを書いて、すぐに結果を確認したい時、データをグラフにして見たい時、またはプログラムについての質問がある場合などに、ChatGPT  Advanced Data Analysis(Code interpreter)が役立ちます。

ChatGPT  Advanced Data Analysis(Code interpreter)の活用事例

 Advanced Data Analysis(Code interpreter)はさまざまなことが可能で、いろんな情報があって、結局何ができるの?という方も多いと思います。

以下に Advanced Data Analysis(Code interpreter)でできることをまとめました!

 Advanced Data Analysis(Code interpreter)でできること ・データ解析
・オーディオファイルの解析
・シミュレーションやモデリング
・プログラミング学習やコーディングサポート
・文書の解析
・ファイル形成、変換
・QRコード生成
・画像処理
・長期記憶

こんな感じですかね。他にもたくさんできることがあると思いますが、一般的に言われている内容を並べてみました。

兼松洋輔

今後AITechWorldではそれぞれ説明していくので、お待ちください!

ChatGPT  Advanced Data Analysis(Code interpreter)の使い方

ChatGPT  Advanced Data Analysis(Code interpreter)は、ChatGPTの有料プランである、ChatGPT Plusに入会する必要があります。月額20ドルかかります。

ChatGPTの有料プランやChatGPT  Advanced Data Analysis(Code interpreter)については、以下の記事で詳しく説明してあります!

ChatGPT(チャットGPT)無料版と有料版の違いは?有料版の料金とメリットをご紹介!

 

ChatGPT Plusへの入会ができたら、ChatGPT Code interpreterを起動させていきます。(ChatGPTを開く)

左下のアカウントのメールアドレスが書いてあるところの右側にある…をクリックすると、このような画面が開きます。

ChatGPTの設定をするためにSetting&Betaをクリックするときの画像

出典) ChatGPT

Settings & Betaをクリックすると、次のような画面になります。

ChatGPTでpluginとCodeInterpreterを起動させるときの画像

出典) ChatGPT

このように、Pluginと Advanced Data Analysis(Code interpreter)というのが見えると思いますので、ここをオンにします。

ChatGPTでCode interpreterとpluginが追加されていることを示す画像

出典) ChatGPT

GPT4のところにカーソルを合わせると、このように Advanced Data Analysis(Code interpreter)が追加されているはずです!

 Advanced Data Analysis(Code interpreter)でグラフを作る方法

 Advanced Data Analysis(Code interpreter)ではグラフを作ることができると述べましたが、さまざまなグラフを作ることが可能です。

 Advanced Data Analysis(Code interpreter)で作れるグラフ ・折れ線グラフ/エリアグラフ
・棒グラフ/ヒストグラム(+エラーバー)
・円グラフ
・散布図
・箱ひげ図
・ペアプロット
・ヒートマップ
・3Dグラフ
・等高線図

大体こんなもんですかね。

兼松洋輔

一般的なグラフはなんでも作れると思って大丈夫だと思います!

① データを用意する

まずは、グラフを作るデータを用意します。

一般的にデータ分析をしたい時はExcelやCSVなどのファイルにデータは入っていると思うので、そのようなデータファイルが用意できていれば大丈夫です。

今回は、北海道の室蘭市の年齢別人口統計が載っているサイトがあったので、こちらのデータを借用してExcelに吐き出したものを使おうと思います。

② プロンプトを入力する

次にプロンプトを入力していきます。

ヒストグラム

Code interpreterでヒストグラムを作る時のプロンプト入力画面

出典)ChatGPT

Prompt#あなたはデータ解析のプロとして振る舞ってください。
#ファイルについて
アップロードしたファイルは室蘭市の年齢別人口に関するファイルです。
10歳ずつの階級に分け、ヒストグラムを作ってください。

Code interpreterで作ったヒストグラムの画像

出典)ChatGPT

こんな感じでヒストグラムを作ってくれました!

日本語が文字化けしていますが、ここの対処法については後述します!ちゃんと文字化けを防ぐことができるので心配しないでくださいね。

円グラフ

一度他のグラフを作った場合、以下のような簡単なプロンプトを入力するだけで、新しいグラフも簡単に作ることが可能です。

Code interpreterで円グラフを作る時のプロンプト入力画面

出典)ChatGPT

Promptそれでは、以下の階級に分けて、円グラフを作ってください。
乳幼児・幼児 0~6歳
小学生 7~12歳
中学生・高校生 13~18歳
若者・大学生 19~24歳
若い成人 25~34歳
中年 35~49歳
壮年 50~64歳
高齢者 65歳以上

Code interpreterを用いて作った円グラフの画像

出典)ChatGPT

折れ線グラフ

Code interpreterで折れ線グラフを作る時のプロンプト入力画面

出典)ChatGPT

Prompt室蘭市の年齢別人口を用いて、折れ線グラフを作ってください。

Code interpreterを用いて生成した折れ線グラフの画像

出典)ChatGPT

 

③ グラフを修正する

ChatGPT  Advanced Data Analysis(code interpreter)でグラフを作った際、色んな要素を直したくなると思います。

そんな時は、一つずつ指示して修正していきます。

兼松洋輔

Code interoreterの傾向を掴んで最初から指定した場合、工程が少なくて済みますね。

日本語の文字化け

 Advanced Data Analysis(Code interpreter)でグラフを作った時に、日本語だとほぼ必ず文字化けするという問題があります。いわゆる”豆腐”と言うみたいです。

そこで、対処法として、Google Fontsなどで日本語のTTFファイルをダウンロードしてChatGPTにアップロードし、それを使ってもらうことで、文字化けがほぼ100%消えます!

例えば、先ほどの折れ線グラフならば、こんな感じに入力します。

Code interpreterで作ったグラフの日本語の文字化けを直す時のプロンプト入力画面

出典)ChatGPT

Prompt日本語が文字化けしているので、今アップロードした日本語ファイルを用いてください。折れ線グラフの、軸や見出しのラベルを直して欲しいです。

Code interpreterで出力した、日本語の文字化けを訂正した折れ線グラフ

出典)ChatGPT

先ほどのグラフと比較していただきたいのですが、見出しや縦軸、横軸の日本語が文字化けせずにちゃんと反映されていることがわかります。

これでは二度手間でめんどくさいという方もいると思うので、手間を減らしたり、確率をもっと高める方法を2種類紹介します!

2種類の方法・データのファイル(ExcelやCSV)とTTFファイルをZIPファイルに入れて最初にアップロードする。
・真似するコードを載せる。

先ほどは、フォントファイルを後からアップロードしましたが、今回は最初にZIPファイルにまとめることで、二度手間を防げます。

また、真似するコードをChatGPTに入力することで、日本語の文字化けをほぼ100パーセント防げます。これは自分でコードを書く必要はなく、ChatGPT  Advanced Data Analysis(Code interpreter)が成功した時に、フォントの適応に関するコードを抽出してもらうことで可能です!

兼松洋輔

日常的に使っていきたいという方は特にお勧めします!

Prompt今回フォントの適応に使用したコードを抽出して教えてください。

Code interpreterで日本語のフォント適応に成功したコードを抽出してもらった時の出力画面

出典)ChatGPT

こんな感じで、成功した時のコードを抽出してくれるので、これを保存しておいて、新しく同様のグラフを作るときにコピペしてあげると失敗しません。

Promptフォントの適応に関しては以下のコードを用いてください。
(先ほどのコードをコピペ)

兼松洋輔

文字化けの対応だけでなく、フォントの大きさなどのこだわりや、その他の条件に関してもこれは使えると思います!

④ 人口ピラミッドを作ってみた!

ここではアイキャッチ画像になっている、人口ピラミッドを作ってみた時の作業をご紹介します。初めて作業する方でも15分もあればこの程度であれば作れるので、ぜひチャレンジしてみてください!

Code interpreterを用いて生成した、室蘭市の人口ピラミッド

出典)ChatGPT

最初のプロンプトこのファイルを用いて、年齢別人口のグラフを作ってください。人口ピラミッドの形で作ってください。

最初はこのような人口ピラミッドができました。

ChatGPT Code interpreterで生成した最初の人口ピラミッド

出典)ChatGPT

ここから、以下の4つを修正しました。

修正事項①年齢層別で色を変える/男女で、それぞれ色の系統を揃える
②文字化けを直す
③横軸の数値を直す
④10代, 20代, 30代,,,,といったラベルをグラフ内に追加/背景を白塗りにする

それぞれについて説明します。文字化けに関しては先ほど説明したので省略します!

年齢層別に色を変える

一つ目は年齢層別に色を変えてあげた方が、どのような年齢層が多いかなどが可視化できてわかりやすいと思ったので、修正しました。

Prompt乳幼児・幼児 0~6歳
小学生 7~12歳
中学生・高校生 13~18歳
若者・大学生 19~24歳
若い成人 25~34歳
中年 35~49歳
壮年 50~64歳
高齢者 65歳以上 で色を変えてください

また、男女で色を揃えた方がごちゃごちゃしないと思ったので、以下のプロンプトも追加しました。

Prompt男女で色を変えて欲しいので、男は青系統、女は赤系統の色にし、年齢別の色の変化に関しては、青系統、赤系統の色で変化をつけてください。

年代別のラベルをグラフ内に追加する/背景を白抜きにする

具体的に何歳が多いのかをわかりやすくするために、年代別のラベルをグラフ内に追加しました。

Prompt年齢がわかりやすいように、10代, 20代, 30代,,,,といったラベルをグラフ内に追加してください。

しかし、それでは黒い文字がグラフ内に入ってしまって見えにくかったので、背景を白抜きにしました。

Prompt10代, 20代, 30代,,,,といったラベルが少し見えにくいので、文字の部分の背景だけ白抜きにすることはできますか?

兼松洋輔

このように、一つ一つ指示することで、見栄えをどんどん改善してくれます!

最終的には、以下のような人口プラミッドが完成しました!

Code interpreterを用いて生成した、室蘭市の人口ピラミッド

出典)ChatGPT

プロ目線で見ても完璧かはわかりませんが、逆に言うとこのレベルを15分くらいで作ることができるので、簡単に可視化したい時などはめちゃくちゃ便利だなあと思いました。

 Advanced Data Analysis(Code interpreter)の注意点

ChatGPTで機密情報を用いる際には、Chat history & training」をオフにしておくことを推奨します。

具体的な個人情報や機密情報を「Chat history & training」がオンの状態で入力すると、それがChatGPTの学習に使われてしまい、他の人がChatGPTを用いた際に出力結果として出てきてしまう可能性があります。(可能性としては低いですが。)

今回用いたAdvanced Data AnalysisやPluginを用いる際、ChatGPT Plusの個人プランの場合、「Chat history & training」をオフにすることができません。

そのような時には、最近ChatGPTから発表された法人向けプラン「ChatGPT Enterprice」の利用をお勧めします。

兼松洋輔

「ChatGPT Enterprice」では、データは暗号化され一切学習に用いることはなく、またAdvenced Data Analysis(Code interpreter)も使い放題になっています!

まとめ

今回はChatGPT  Advanced Data Analysis(Code interpreter)でグラフを作る方法についてご紹介しました!まだ完璧ではない部分もありますが、直感的に作業してこのレベルでグラフが作れるツールは他にないように思います。

課題があってもそれを直して欲しいと指示するだけで解決するのも素晴らしいですよね。

他のグラフや Advanced Data Analysis(Code interpreter)の他の使い方ついてもどんどん更新していきます!

関連記事

https://aitechworld.info/advanced-data-analysis/

 

この記事は役に立ちましたか?

もし参考になりましたら、下記のボタンで教えてください。

関連記事

コメント

この記事へのコメントはありません。