Shisa V2.1とは?Shisa.AIが発表した「小さく賢い」日本語LLMの進化とAPI提供を徹底解説

📰 AIニュース

より小さく、より賢く

Shisa V2.1は、より小さなモデルサイズでShisa V2を超える日本語性能を実現しています。具体的には、Shisa V2.1 14Bモデルは、Shisa V2 70Bモデルを超える日本語性能を達成しました。これにより、5分の1以下のサイズで、より高速かつ少ないメモリで動作することが可能になります。

さらに、Shisa V2.1 70Bモデルは、国産LLMとして最高性能とされるShisa V2 405Bモデルに迫る性能を発揮しながら、約6分の1のサイズを実現しています。モデルのパラメータ数が小さいほど、必要なメモリが少なくなり、推論速度も向上するため、同等の性能をより低コストで、より幅広い環境で利用できるようになります。

この改善は、データセットの80%以上を一新し、SFT(教師ありファインチューニング)・DPO(直接選好最適化)に加えてRL(強化学習)やモデルマージ技術を取り入れたことで可能となりました。ベンチマークに特化した学習は行われておらず、実環境での日本語能力の向上が反映されています。

モデル性能比較

ライセンス モデル名 パラメータ数 日本語AVG 英語AVG JA-MT
Llama 3.1 Shisa V2 405B 405B 74.7 67.5 9.43
Llama 3.3 Shisa V2.1 70B 70B 73.1 66.0 9.26
MIT Shisa V2.1 14B 14B 72.6 57.7 9.28
Apache 2.0 Shisa V2.1 8B 8B 67.8 57.8 8.93
Llama 3.2 Shisa V2.1 3B 3B 57.9 43.2 7.55
LFM Shisa V2.1 1.2B 1.2B 43.4 27.6 6.69

上記の表には、日本語・英語それぞれのテストの平均スコアに加え、GPT-4 Turboを評価者とした日本語MT-Benchスコアも掲載されています。

正確な日本語出力を実現

近年、日本語に対応したLLMは急速に増加していますが、海外モデルだけでなく国内で学習されたモデルでも、日本語出力の途中で中国語や英語などが混入する「言語漏れ」現象が見られます。Shisa.AIは、この「言語漏れ」を業界で初めて定量化する評価手法(Cross-Lingual Token Leakage)を開発しました。Shisa V2.1は、ベースモデルと比較して最大47.8倍の改善を達成し、検証した他のほぼすべてのモデルを上回る結果となりました。言語の混在は、翻訳、カスタマーサポート、コンテンツ生成など、実用的な日本語アプリケーションにとって重大な問題であり、この改善は多大な意味を持ちます。

言語漏れ率の改善

ベースモデル Shisa V2.1 ベース漏れ率 V2.1漏れ率 改善倍率
Llama 3.2 3B Shisa V2.1 3B※ 11.48% 0.24% 47.8×
LFM2 1.2B Shisa V2.1 1.2B 4.32% 0.32% 13.5×
Qwen 3 8B Shisa V2.1 8B 2.18% 0.44% 5.0×
Llama 3.3-70B Shisa V2.1 70B※ 1.90% 0.36% 5.3×
Phi 4 14B Shisa V2.1 14B 0.12% 0.06% 2.0×

API提供・商用サービスの開始

Shisa V2.1のリリースに合わせて、テキスト・翻訳・音声APIの提供も開始されました。個人ユーザーから法人まで、高品質な日英翻訳を試せるShisa V2ベースの翻訳サービス「chotto.chat」も公開されています。高性能な大規模モデルを試す際のコストや環境構築のハードルが高いという声に応え、OpenRouterで利用しやすい価格設定と無料枠付きで提供される予定です。専用キャパシティ、オンプレミス導入、カスタム学習などの要望にも対応しています。

Shisa V2モデルは経済産業省GENIAC国産モデルとして承認されており、計算資源は日本国内でホストされています。これにより、低レイテンシはもちろん、データレジデンシーや規制対応が求められる用途にも安心して利用できます。

AMDハードウェアでの学習

Shisa V2.1の学習は、AMD Developer Cloudが提供するAMD MI300X GPUで実施されました。これは日本で開発された大型LLMとして、初めてAMDハードウェアで学習されたモデルです。学習効率を向上させる独自の改良も実施され、オープンソースとして公開されています。

Shisa.AIについて

Shisa.AIは、シリコンバレー発の技術チームを中核とする次世代AIスタートアップです。「日本語特化AI」と「データドリブン開発」を軸に、オープンソースLLMの進化をリードし、日本発のAIイノベーションを世界へ発信することを目指しています。

関連リンク


AI Workstyle Lab編集部コメント

Shisa.AIの「Shisa V2.1」リリースは、ビジネスにおけるAI活用を大きく加速させる可能性を秘めています。より小型で高性能な日本語LLMがAPI提供されることで、これまでコストや技術的障壁が高かった企業でも、自社サービスへの組み込みが容易になるでしょう。特に、言語漏れの大幅な改善は、日本語特有の顧客対応やコンテンツ生成、社内文書の自動翻訳など、多岐にわたる業務でその真価を発揮すると考えられます。これにより、業務効率化や新たな顧客体験の創出に繋がり、企業の競争力向上に貢献することが期待されます。国産モデルとして日本国内でのホスト環境が提供される点も、データガバナンスを重視する企業にとって大きなメリットとなるでしょう。

📘 もっと基礎から学びたい人へ|無料で参加できるAIセミナーまとめ

「AIニュースは追っているけど、何から学べばいいか分からない…」 そんな初心者向けに、編集部が本当におすすめできる無料AIセミナーを厳選しました。

🔰【初心者向け】生成AIを基礎から学べる無料セミナーまとめ
  • 完全無料で参加できるAIセミナーだけを厳選
  • ChatGPT・Geminiを基礎から体系的に学べる
  • 比較しやすく、あなたに合う講座が一目で分かる
無料で学べるAIセミナー一覧を見る
生成AI学習に取り残されないために…
ChatGPTなどの生成AIを使いこなして、仕事・収入・時間の安定につながるスキルを身につけませんか?

AI Workstyle LabのAIニュースをチェックしているあなたは、すでに一歩リードしている側です。あとは、 実務で使える生成AIスキルを身につければ、「知っている」から「成果を出せる」状態へ一気に飛べます。

ChatGPT無料セミナー|ゼロから2時間で学べる生成AI活用講座
PR|生成AIスクール
🧠 実践型 生成AIスクール「スタートAI」

講師:栗須俊勝(AI総研)
30社以上にAI研修・業務効率化支援を提供。“大阪の生成AIハカセ”として企業DXを牽引しています。

  • 日々の業務を30〜70%時短する、実務直結の生成AI活用法を体系的に学べる
  • 副業・本業どちらにも活かせる、AI時代の「稼ぐためのスキルセット」を習得
  • 文章・画像・資料作成など、仕事も趣味もラクになる汎用的なAIスキルが身につく

ニュースを読むだけで終わらせず、
「明日から成果が変わるAIスキル」を一緒に身につけましょう。

【編集ポリシー】

本記事は、各社の公式発表および公開情報を基に、AI Workstyle Lab編集部が 事実確認・再構成を行い作成しています。一次情報の内容は編集部にて確認し、 CoWriter(AI自動生成システム)で速報性を高めつつ、最終的な編集プロセスを経て公開しています。

【初心者向け】
生成AIスクール
無料セミナー比較

独学に限界を感じたら。実務で使えるAIスキルを最短で。
まずは無料セミナーで「自分に合う学び方」を見つけましょう。

無料セミナーを見る
※比較記事・体験談つき。学び方で迷う人ほど相性◎
この記事には一部PRが含まれます

本記事は筆者の実体験・一次情報をもとに作成していますが、一部にアフィリエイトリンク(PR)が含まれています。

記事内容や評価は、PR有無に関わらず筆者の正直な見解です。

この記事の情報
記事の著者
AI Workstyle Lab 編集部

ChatGPTやAIツールを中心に、AI時代の「学び・働き方・キャリア」をアップデートする情報を発信。
AI Workstyle Labは、AIと共に進化する働き方を提案するメディアです。
AI Workstyle Lab編集部は、人間の編集者が監修し、150本以上の記事をChatGPT × 校正AIで制作しています。

AI Workstyle Lab 編集部をフォローする
📰 AIニュース
スポンサーリンク
AI Workstyle Lab 編集部をフォローする
タイトルとURLをコピーしました