今回は、Metaが新たにリリースしたオープンソースの大規模言語モデル「Llama 3」について詳しく見ていきましょう。きっと、みなさんの創造力を刺激する素晴らしいツールだと思います。
目次
Llama 3の概要
Llama 3とは
Llama 3は、Metaが開発した最先端のオープンソースLLMです。言語のニュアンスや文脈の理解、翻訳や対話生成などの複雑なタスクにおいて優れたパフォーマンスを発揮します。スケーラビリティと性能が向上し、マルチステップのタスクもお手のものです。Llama 3は、高度な言語処理だけでなく、推論やコード生成、命令に従うといった能力も大幅に向上しています。
今回のLlama3の登場がビッグニュースである理由の一つにLlama3がオープンソースLLMであるということがあります。おオープンソースで高性能LLMモデルができたとなればLlama3はゲームチェンジャーになるかもしれません。オープンソースLLMの特徴について詳しく知りたい方はこちらの記事をご覧ください!
Llama 2との違い
Llama 3は、先代のLlama 2から大きな進化を遂げました。一体どんなところが変わったのでしょうか?
トレーニングデータセットの拡大
Llama 3は、Llama 2の7倍もの大規模なデータセットでトレーニングされています。なんと、コードの量はLlama 2の4倍にも及びます。これにより、Llama 3はより多様な知識を身につけ、幅広いタスクに対応できるようになりました。
新たな機能の追加
Llama 3には、新しい機能がいくつも追加されています。例えば、8192トークンのシーケンスでトレーニングされたことで、Llama 2の2倍のコンテキスト長に対応できるようになりました。より長い文脈を理解し、複雑な会話もスムーズに進められるでしょう。
パフォーマンスの向上
こちらが、Llama2が発表された当初のLlama2のベンチマークとなっています。
Metaが開発した新しいトレーニングスタックにより、Llama 3のトレーニング効率はLlama 2の約3倍にまで向上しました。また、ポストトレーニングの手順を改善したことで、誤った拒否率が大幅に減少し、より多様な応答が可能になっています。
こちらの画像は、Llama3と他のLLMとのベンチマーク比較となっています。2枚の画像を見ればわかる通り、Llama 3はほとんどの指標でLlama 2を上回るパフォーマンスを示しています。Llama 3なら、より自然で賢い対話を実現できるはずです。
Llama 3のモデル
Llama 3には、現在2つのモデルが用意されています。将来的にはさらに大きなモデルも登場する予定です。それぞれのモデルの特徴を見ていきましょう。
8Bモデル
8Bモデルは、80億のパラメータを持つLlama 3の基本モデルです。事前トレーニングとファインチューニングを経て、幅広いタスクに対応できるようになっています。比較的小さなモデルながら、高い性能を発揮します。
70Bモデル
70Bモデルは、700億のパラメータを持つ大規模モデルです。8Bモデルよりもさらに高度な言語処理が可能で、複雑なタスクもこなせます。オープンソースのLLMの中では、トップクラスの性能を誇ります。
400Bモデル(開発中)
Metaは現在、400Bモデルの開発を進めています。このモデルは、4000億のパラメータを持つ超大規模モデルになる予定です。完成すれば、Llama 3の性能はさらに飛躍的に向上するでしょう。リリースが待ち遠しいですね。
Llama 3の性能
Llama 3は、他のオープンソースモデルと比べてどれほどの性能を持っているのでしょうか?ベンチマーク結果と実世界での評価を見ていきましょう。
ベンチマーク結果
オープンモデルとの比較
Llama 3 8Bモデルは、MMLU、ARC、DROP、GPQAなど、少なくとも9つのベンチマークで他のオープンモデルを上回る性能を示しました。Mistral 7BやGemma 7Bなどの強力なモデルを凌ぐ結果です。
同等モデルとの比較
Llama 3 70Bモデルは、Google Gemini 1.5 ProやClaude 3といった同等のモデルと比べても、一部のベンチマークで高いスコアを記録しています。オープンソースモデルの中でもトップクラスの性能と言えるでしょう。
実世界での評価
ベンチマークだけでなく、実際の使用シナリオに沿った評価も行われています。Metaは、12の主要なユースケースに対応する1800のプロンプトを用意し、人間の評価者によるスコアリングを実施しました。Llama 3は、Claude SonnetやMistral Medium、GPT-3.5を上回る評価を得ました。
Llama 3の使い方
Llama 3を使ってみたいと思ったあなた。どうすれば使えるようになるのでしょうか?ここでは、Llama 3の使い方を簡単に説明します。
Llama3のはじめ方
Llama 3の各モデルは、Metaのウェブサイトからダウンロードできます。
画像内側のライセンス条項に同意し、必要な情報を入力しましょう!
こちらの画面では利用規約が書かれており、チェック欄にチェックを入れることで利用規約に同意することができます。同意したら、「Accept and continue」をクリックしましょう。メールアドレスに認証用のURLが送られてきます。
しかしこれだけでは、ダウンロードは完了しません!
こちらのgithubから、指示に従ってdownload.sh スクリプトを実行し、URLをこちらに渡す必要があるのです。詳しい方法はgithubをご覧ください!
メタAIでの体験
日本では、まだ使うことができないのですが、Llama 3の性能を手軽に体験したいなら、「Meta AI」からLlama3 を使うこともできるようです。
こちらはアメリカでベータ版が公開されているクローズドLLMのような形式をとっているサービスとなっています。コーディングタスクや問題解決など、様々な場面であなたをサポートしてくれます。
Llama 3の料金
オープンソースモデルとして公開されているLlama 3ですが、利用条件は気になるところです。研究目的と商用利用に分けて、料金体系を説明しましょう。
研究目的での利用
研究目的であれば、Llama 3は無償で利用できます。学術機関やそれに準ずる組織が、非営利の目的でLlama 3を使う場合は、料金はかかりません。ただし、利用にあたってはライセンス条項に同意する必要があります。
商用利用の条件
商用利用の場合は、いくつかの条件があります。月間アクティブユーザー数が7億人以下であれば無償で利用できますが、それを超える場合は有償になります。詳細な料金体系は公開されていませんが、利用規模に応じた料金が設定されると考えられます。
まとめとLlamaの今後
今回は、オープンソースLLM Llamaの新モデルLlama3についてご紹介していきました。性能の高さから今後さらに注目が集まっていきますが、Llama3はさらに進歩していくようです。
Llama 3の今後
新機能の追加予定
今後数ヶ月の間に、Llama 3には新しい機能が追加される予定です。マルチモーダル対応、より長いコンテキストウィンドウ、全体的な性能向上などが期待されています。
マルチモーダル・多言語モデルの開発
Llama 3は、将来的にマルチモーダルかつ多言語対応のモデルになる予定です。マルチモーダルとは、テキストだけでなく、画像や音声などの複数の情報を扱えるLLMのことです。これによってPDFファイルや画像の情報からLlama 3に回答をしてもらうことができるようになります。
また、英語以外の言語でも高い性能を発揮できるようになります。
まとめ
今回は、オープンソースLLM Llamaの新モデルLlama3についてご紹介していきました。王道のChatGPT、新生のClaudeに次いでまた、LLMの勢力図が変わる可能性のある要素が生まれました!
今後のマルチモーダルを含んだアップデートによってどのようにLlamaが変化していくのかも目が離せませんね。
この記事は役に立ちましたか?
もし参考になりましたら、下記のボタンで教えてください。
コメント