より小さく、より賢く
Shisa V2.1は、より小さなモデルサイズでShisa V2を超える日本語性能を実現しています。具体的には、Shisa V2.1 14Bモデルは、Shisa V2 70Bモデルを超える日本語性能を達成しました。これにより、5分の1以下のサイズで、より高速かつ少ないメモリで動作することが可能になります。
さらに、Shisa V2.1 70Bモデルは、国産LLMとして最高性能とされるShisa V2 405Bモデルに迫る性能を発揮しながら、約6分の1のサイズを実現しています。モデルのパラメータ数が小さいほど、必要なメモリが少なくなり、推論速度も向上するため、同等の性能をより低コストで、より幅広い環境で利用できるようになります。
この改善は、データセットの80%以上を一新し、SFT(教師ありファインチューニング)・DPO(直接選好最適化)に加えてRL(強化学習)やモデルマージ技術を取り入れたことで可能となりました。ベンチマークに特化した学習は行われておらず、実環境での日本語能力の向上が反映されています。
モデル性能比較
| ライセンス | モデル名 | パラメータ数 | 日本語AVG | 英語AVG | JA-MT |
|---|---|---|---|---|---|
| Llama 3.1 | Shisa V2 405B ※ | 405B | 74.7 | 67.5 | 9.43 |
| Llama 3.3 | Shisa V2.1 70B ※ | 70B | 73.1 | 66.0 | 9.26 |
| MIT | Shisa V2.1 14B | 14B | 72.6 | 57.7 | 9.28 |
| Apache 2.0 | Shisa V2.1 8B | 8B | 67.8 | 57.8 | 8.93 |
| Llama 3.2 | Shisa V2.1 3B ※ | 3B | 57.9 | 43.2 | 7.55 |
| LFM | Shisa V2.1 1.2B | 1.2B | 43.4 | 27.6 | 6.69 |
上記の表には、日本語・英語それぞれのテストの平均スコアに加え、GPT-4 Turboを評価者とした日本語MT-Benchスコアも掲載されています。
正確な日本語出力を実現
近年、日本語に対応したLLMは急速に増加していますが、海外モデルだけでなく国内で学習されたモデルでも、日本語出力の途中で中国語や英語などが混入する「言語漏れ」現象が見られます。Shisa.AIは、この「言語漏れ」を業界で初めて定量化する評価手法(Cross-Lingual Token Leakage)を開発しました。Shisa V2.1は、ベースモデルと比較して最大47.8倍の改善を達成し、検証した他のほぼすべてのモデルを上回る結果となりました。言語の混在は、翻訳、カスタマーサポート、コンテンツ生成など、実用的な日本語アプリケーションにとって重大な問題であり、この改善は多大な意味を持ちます。
言語漏れ率の改善
| ベースモデル | Shisa V2.1 | ベース漏れ率 | V2.1漏れ率 | 改善倍率 |
|---|---|---|---|---|
| Llama 3.2 3B | Shisa V2.1 3B※ | 11.48% | 0.24% | 47.8× |
| LFM2 1.2B | Shisa V2.1 1.2B | 4.32% | 0.32% | 13.5× |
| Qwen 3 8B | Shisa V2.1 8B | 2.18% | 0.44% | 5.0× |
| Llama 3.3-70B | Shisa V2.1 70B※ | 1.90% | 0.36% | 5.3× |
| Phi 4 14B | Shisa V2.1 14B | 0.12% | 0.06% | 2.0× |
API提供・商用サービスの開始
Shisa V2.1のリリースに合わせて、テキスト・翻訳・音声APIの提供も開始されました。個人ユーザーから法人まで、高品質な日英翻訳を試せるShisa V2ベースの翻訳サービス「chotto.chat」も公開されています。高性能な大規模モデルを試す際のコストや環境構築のハードルが高いという声に応え、OpenRouterで利用しやすい価格設定と無料枠付きで提供される予定です。専用キャパシティ、オンプレミス導入、カスタム学習などの要望にも対応しています。
Shisa V2モデルは経済産業省GENIAC国産モデルとして承認されており、計算資源は日本国内でホストされています。これにより、低レイテンシはもちろん、データレジデンシーや規制対応が求められる用途にも安心して利用できます。
AMDハードウェアでの学習
Shisa V2.1の学習は、AMD Developer Cloudが提供するAMD MI300X GPUで実施されました。これは日本で開発された大型LLMとして、初めてAMDハードウェアで学習されたモデルです。学習効率を向上させる独自の改良も実施され、オープンソースとして公開されています。
Shisa.AIについて
Shisa.AIは、シリコンバレー発の技術チームを中核とする次世代AIスタートアップです。「日本語特化AI」と「データドリブン開発」を軸に、オープンソースLLMの進化をリードし、日本発のAIイノベーションを世界へ発信することを目指しています。
関連リンク
AI Workstyle Lab編集部コメント
Shisa.AIの「Shisa V2.1」リリースは、ビジネスにおけるAI活用を大きく加速させる可能性を秘めています。より小型で高性能な日本語LLMがAPI提供されることで、これまでコストや技術的障壁が高かった企業でも、自社サービスへの組み込みが容易になるでしょう。特に、言語漏れの大幅な改善は、日本語特有の顧客対応やコンテンツ生成、社内文書の自動翻訳など、多岐にわたる業務でその真価を発揮すると考えられます。これにより、業務効率化や新たな顧客体験の創出に繋がり、企業の競争力向上に貢献することが期待されます。国産モデルとして日本国内でのホスト環境が提供される点も、データガバナンスを重視する企業にとって大きなメリットとなるでしょう。
ChatGPTなどの生成AIを使いこなして、仕事・収入・時間の安定につながるスキルを身につけませんか?
AI Workstyle LabのAIニュースをチェックしているあなたは、すでに一歩リードしている側です。あとは、 実務で使える生成AIスキルを身につければ、「知っている」から「成果を出せる」状態へ一気に飛べます。
講師:栗須俊勝(AI総研)
30社以上にAI研修・業務効率化支援を提供。“大阪の生成AIハカセ”として企業DXを牽引しています。
- 日々の業務を30〜70%時短する、実務直結の生成AI活用法を体系的に学べる
- 副業・本業どちらにも活かせる、AI時代の「稼ぐためのスキルセット」を習得
- 文章・画像・資料作成など、仕事も趣味もラクになる汎用的なAIスキルが身につく
ニュースを読むだけで終わらせず、
「明日から成果が変わるAIスキル」を一緒に身につけましょう。
無料セミナー参加者限定|生成AI活用に役立つ12個の特典を見る
- 特典01|業務効率化プロンプト集50選
業務でそのまま使えるプロンプトを50個厳選し、日々のタスクを一気に効率化できます。 - 特典02|爆速で学ぶ!ChatGPT実践ワークブック
ChatGPTを仕事に落とし込む具体テクニックをワーク形式で習得できます。 - 特典03|シングルライン(一行)プロンプティング習得ガイド
一行でAIの性能を引き出す“効くプロンプト”の使い方が短時間で理解できます。 - 特典04|たった1行で成果を出すシングルライン実例集
実務で使われている一行プロンプトの成功例を多数収録しています。 - 特典05|ChatGPTで仕事が変わる!最強の実践ガイド
AI時代の「ラクして成果を出す」働き方を体系的に学べる一冊。 - 特典06|プロンプト改善キラーテクニック大全
回答を“神回答”に変える改善テクニックをまとめています。 - 特典07|この一冊で丸わかり AI業務効率化ガイド
業務をどこまでAIに任せるかが一目でわかる自動化ガイド。 - 特典08|ChatGPTで激変する 問題解決の新常識
思考・企画・リスク整理など、問題解決にAIを使う方法を解説。 - 特典09|仕事も趣味も丸投げ!汎用プロンプト大全
どんな場面でも使える万能プロンプト集を多数収録。 - 特典10|AI導入チェックリスト 業務改革編
AI導入で押さえるべき重要ポイントを簡潔にまとめています。 - 特典11|AIビジネススタートガイド
AIを活用した小さなビジネスの始め方をステップ形式で解説。 - 特典12|ChatGPT トラブル解決の極意
AI活用時のトラブルを素早く解決する具体策をまとめています。
「AIニュースは追っているけど、何から学べばいいか分からない…」 そんな初心者向けに、編集部が本当におすすめできる無料AIセミナーを厳選しました。
- 完全無料で参加できるAIセミナーだけを厳選
- ChatGPT・Geminiを基礎から体系的に学べる
- 比較しやすく、あなたに合う講座が一目で分かる
本記事は、各社の公式発表および公開情報を基に、AI Workstyle Lab編集部が 事実確認・再構成を行い作成しています。一次情報の内容は編集部にて確認し、 CoWriter(AI自動生成システム)で速報性を高めつつ、最終的な編集プロセスを経て公開しています。

