本記事で解説するのは、英国のスタートアップ企業であるStability AIが開発した大規模言語モデル「StableLM」です。
Stability AIは、2022年にも画像生成AIである「Stable Diffusion」を開発しており、大きな注目を集めた企業ですね。
StableLMは大規模言語モデルという立ち位置から、オープンAIの「ChatGPT」やGoogleの「Bard」などと競合同士になり得るので、利用者はそれぞれのサービスを比較する必要がありますね。
本記事では、StableLMの概要や使い方、登録方法を解説しながら、StableLMの大きな特徴についても触れていきます。
目次
第1章 StableLMとは
StableLMは、Stability AIが2023年4月に発表した大規模言語モデルです。
このAiのモットーは「みんなが作る、みんなのためのAI」
ユーザー自身のデバイスでモデルを設計できることが、このモットーを最もよく表しているでしょう。StableLMの特徴を知れば知るほど、このAIがいかに利用者目線で開発されたAIなのかを知ることができると思います。
人工知能は人間の労働や作業を「置き換える」という目的で使用が進むことがありますが、StableLMの立場はあくまでも「ユーザーにサポートを提供する」こと。「専門的、効率的、実用的」な性能を追求した開発が行われています。
StableLMの特徴
①オープンソースを採用している
StableLMはオープンソースを採用しているため、開発の過程などは無償で公開されています。
そのため、開発者側はStableLMのソースを使用しながら、自身のデバイスで性能の検証やリスクの特定などに取り組めます。かなり透明性が高いLLMであると言えそうです。
②アクセスしやすい
利用者目線に立ったAIだからこそ、AIへのアクセスのしやすさも追求されています。
専門知識を持ったエンジニアだけでなく、一般のユーザーであっても利用できるような設計がなされています。
③パラメータが少ない
StableLMは30億個と70億個のパラメータで構成された2種類のモデルが存在します。パラメータ数は基本的にモデルの学習に使用したデータ量に依存するのですが、ChatGPT3.5が1700億個であることを考えるとかなり少ないと言えます。
このパラメータが少ないという点により性能には不安が残りますが、ある意味少ないパラメータでもうまく動作するLLMを構築できることが示された点では重要かと思います。
また、今後 150億パラメータと650億パラメータの2つの強化モデルをリリースする予定であることを公表しておりますので期待ができそうです。
第2章 StableLMの始め方と使い方
StableLMの始め方は2通りあります。
【無料】Hugging Faceのサイトから使う
コーディング無しで利用する場合は、『Hugging Face』のサイト上から実行するのがおすすめです。(リンク)
しかしStable LMは2023年7月時点で日本語に対応していないため、メッセージをやり取りする際は一度英語に翻訳されます。
そのため、翻訳途中で話が噛み合わない可能性があります。
『Hugging Face』については以下の記事で詳しく紹介しています。
Windowsへのインストール
llama.cppを使用する場合は以下の順番でインストール可能です。
llama.cpp(リンク)
そしてmodelsフォルダを作成して、次のモデルを入手します。(リンク)
パスを移動して、
『run: path\to\main.exe -m models\7B\ggml-model-stablelm-tuned-alpha-7b-q4_0.bin -n 128』
を実行すると完了です。
2023年7月現在、StableLMは日本語に対応していないため、日本語では会話が成立しない可能性があります。
日本語には対応していませんが、パラメータ数は非常に多くAIの性能は高いため、英語で会話をすれば非常にいい回答を得られます。
StableLMの料金と商用利用
2023年7月現在、StableLMの利用には料金がかかりません。
また、StableLMで生成したコンテンツは、商用利用、研究目的での利用が可能です。
第3章 まとめ
本記事では、StableLMの概要、特徴、登録方法などを解説しました。
まだ日本語に対応していないため、日本国内への本格上陸がまだ先のことになりますが、日本でも普及する余地があると思います。
AIにはパラメータという性能を左右する数値があるのですが、このStableLMのパラメータは、今日本で普及しつつあるチャットGPTよりもはるかに少ないです。
こんな省エネサイズながらも、膨大なデータセットとコンテンツ量を持つため、高い回答精度を実現できる可能性があるのです。
日本語版の対応にも期待したいですね。
執筆者:河津大誠
この記事は役に立ちましたか?
もし参考になりましたら、下記のボタンで教えてください。
コメント