Shisa V2.1とは？Shisa.AIが発表した「小さく賢い」日本語LLMの進化とAPI提供を徹底解説

より小さく、より賢く
- モデル性能比較
正確な日本語出力を実現
- 言語漏れ率の改善
API提供・商用サービスの開始
AMDハードウェアでの学習
Shisa.AIについて
- 関連リンク
AI Workstyle Lab編集部コメント

より小さく、より賢く

Shisa V2.1は、より小さなモデルサイズでShisa V2を超える日本語性能を実現しています。具体的には、Shisa V2.1 14Bモデルは、Shisa V2 70Bモデルを超える日本語性能を達成しました。これにより、5分の1以下のサイズで、より高速かつ少ないメモリで動作することが可能になります。

さらに、Shisa V2.1 70Bモデルは、国産LLMとして最高性能とされるShisa V2 405Bモデルに迫る性能を発揮しながら、約6分の1のサイズを実現しています。モデルのパラメータ数が小さいほど、必要なメモリが少なくなり、推論速度も向上するため、同等の性能をより低コストで、より幅広い環境で利用できるようになります。

この改善は、データセットの80%以上を一新し、SFT（教師ありファインチューニング）・DPO（直接選好最適化）に加えてRL（強化学習）やモデルマージ技術を取り入れたことで可能となりました。ベンチマークに特化した学習は行われておらず、実環境での日本語能力の向上が反映されています。

モデル性能比較

ライセンス	モデル名	パラメータ数	日本語AVG	英語AVG	JA-MT
Llama 3.1	Shisa V2 405B ※	405B	74.7	67.5	9.43
Llama 3.3	Shisa V2.1 70B ※	70B	73.1	66.0	9.26
MIT	Shisa V2.1 14B	14B	72.6	57.7	9.28
Apache 2.0	Shisa V2.1 8B	8B	67.8	57.8	8.93
Llama 3.2	Shisa V2.1 3B ※	3B	57.9	43.2	7.55
LFM	Shisa V2.1 1.2B	1.2B	43.4	27.6	6.69

上記の表には、日本語・英語それぞれのテストの平均スコアに加え、GPT-4 Turboを評価者とした日本語MT-Benchスコアも掲載されています。

正確な日本語出力を実現

近年、日本語に対応したLLMは急速に増加していますが、海外モデルだけでなく国内で学習されたモデルでも、日本語出力の途中で中国語や英語などが混入する「言語漏れ」現象が見られます。Shisa.AIは、この「言語漏れ」を業界で初めて定量化する評価手法（Cross-Lingual Token Leakage）を開発しました。Shisa V2.1は、ベースモデルと比較して最大47.8倍の改善を達成し、検証した他のほぼすべてのモデルを上回る結果となりました。言語の混在は、翻訳、カスタマーサポート、コンテンツ生成など、実用的な日本語アプリケーションにとって重大な問題であり、この改善は多大な意味を持ちます。

言語漏れ率の改善

ベースモデル	Shisa V2.1	ベース漏れ率	V2.1漏れ率	改善倍率
Llama 3.2 3B	Shisa V2.1 3B※	11.48%	0.24%	47.8×
LFM2 1.2B	Shisa V2.1 1.2B	4.32%	0.32%	13.5×
Qwen 3 8B	Shisa V2.1 8B	2.18%	0.44%	5.0×
Llama 3.3-70B	Shisa V2.1 70B※	1.90%	0.36%	5.3×
Phi 4 14B	Shisa V2.1 14B	0.12%	0.06%	2.0×

API提供・商用サービスの開始

Shisa V2.1のリリースに合わせて、テキスト・翻訳・音声APIの提供も開始されました。個人ユーザーから法人まで、高品質な日英翻訳を試せるShisa V2ベースの翻訳サービス「chotto.chat」も公開されています。高性能な大規模モデルを試す際のコストや環境構築のハードルが高いという声に応え、OpenRouterで利用しやすい価格設定と無料枠付きで提供される予定です。専用キャパシティ、オンプレミス導入、カスタム学習などの要望にも対応しています。

Shisa V2モデルは経済産業省GENIAC国産モデルとして承認されており、計算資源は日本国内でホストされています。これにより、低レイテンシはもちろん、データレジデンシーや規制対応が求められる用途にも安心して利用できます。

AMDハードウェアでの学習

Shisa V2.1の学習は、AMD Developer Cloudが提供するAMD MI300X GPUで実施されました。これは日本で開発された大型LLMとして、初めてAMDハードウェアで学習されたモデルです。学習効率を向上させる独自の改良も実施され、オープンソースとして公開されています。

Shisa.AIについて

Shisa.AIは、シリコンバレー発の技術チームを中核とする次世代AIスタートアップです。「日本語特化AI」と「データドリブン開発」を軸に、オープンソースLLMの進化をリードし、日本発のAIイノベーションを世界へ発信することを目指しています。

AI Workstyle Lab編集部コメント

Shisa.AIの「Shisa V2.1」リリースは、ビジネスにおけるAI活用を大きく加速させる可能性を秘めています。より小型で高性能な日本語LLMがAPI提供されることで、これまでコストや技術的障壁が高かった企業でも、自社サービスへの組み込みが容易になるでしょう。特に、言語漏れの大幅な改善は、日本語特有の顧客対応やコンテンツ生成、社内文書の自動翻訳など、多岐にわたる業務でその真価を発揮すると考えられます。これにより、業務効率化や新たな顧客体験の創出に繋がり、企業の競争力向上に貢献することが期待されます。国産モデルとして日本国内でのホスト環境が提供される点も、データガバナンスを重視する企業にとって大きなメリットとなるでしょう。

📘 もっと基礎から学びたい人へ｜無料で参加できるAIセミナーまとめ

「AIニュースは追っているけど、何から学べばいいか分からない…」そんな初心者向けに、編集部が本当におすすめできる無料AIセミナーを厳選しました。

🔰【初心者向け】生成AIを基礎から学べる無料セミナーまとめ