「KARAKURI VL2」の主な成果とベンチマーク結果
「KARAKURI VL2」は、8Bパラメータの軽量モデルでありながら、特定の業務領域で高い精度を達成しました。特に、画像編集(GIMP)ではClaude Sonnet 4.6の約2倍のスコアを記録し、メール操作(Thunderbird)でも優位性を示しています。また、ベースモデルと比較すると、複数のアプリケーションを横断して操作する「multi_apps」カテゴリで約2.8倍のスコア向上を達成しました。
この評価には、カラクリが開発しオープンソースで公開した日本語PC操作ベンチマーク「OSWorld-JP v0.2」(100タスク)が用いられています。このベンチマークと学習済みモデルは、以下のURLで公開されており、第三者による再現性の検証や国内CUA研究の共通評価基盤としての活用が期待されます。
技術的特長と開発背景
「KARAKURI VL2」の技術的特長は以下の3点です。
- ローカル環境で動作する軽量モデル: 8Bパラメータ設計により、企業のオンプレミス環境での動作が可能で、機密データをセキュアに扱えます。
- 合成データによる業務特化学習: 実際の業務操作パターンを合成データとして活用し、コンタクトセンターなどで日常的に行われる画像編集やメール操作といった特定業務で高精度を実現しました。
- AWS Trainiumによる学習基盤: Qwen3-VLアーキテクチャのTrainium上での大規模学習は、公開事例が確認されていない取り組みです(2026年3月時点)。
今回の開発は、これまで英語環境に最適化されていたCUAモデルの課題と、先行して開発された32Bパラメータモデルの推論コストの高さに対応するために行われました。軽量化と日本語環境での評価基盤の整備を通じて、国内のCUA研究の発展に貢献することを目指しています。
今後の展望とカラクリ株式会社について
カラクリ株式会社は「FriendlyTechnology」をビジョンに掲げ、今回開発された「KARAKURI VL2」を基盤としたAIエージェントアプリケーションのサービス化を推進する予定です。カスタマーサポート領域を起点に、レガシーシステムを含む複数アプリケーション間の操作自動化へと対象を拡大し、自社製品群への統合を進めていくとしています。
ベンチマーク「OSWorld-JP」についても、タスク数の拡充と評価カテゴリの追加を進め、国内CUA研究における標準的な評価基盤としての発展を目指す方針です。また、学習データの拡充とファインチューニング手法の改善により継続的に精度向上に取り組む予定です。
カラクリ株式会社の最高プロダクト責任者(CPO)である中山 智文氏からは、以下のようなコメントが寄せられています。
「日本の産業を支えてきた『現場の磨き上げ(現場力)』をAIの知性に変えることを目指しています。今回の開発では、『業界特化』、『独自データ』、『自前運用』の3つの領域に特化しました。総合性能では海外大手モデルに差があるものの、現場の実務で使われる特定のアプリケーション操作に絞れば、8Bの軽量モデルでも十分な精度が出せることを確認できました。」

カラクリ株式会社に関する詳細は、以下のURLから確認できます。
- カラクリ株式会社:https://karakuri.ai/
AI Workstyle Lab編集部コメント
カラクリが開発した「KARAKURI VL2」は、特定の業務領域に特化することで、軽量ながらも高い実用性を実現した点で注目に値します。特に、画像編集やメール操作といった現場で頻繁に行われるタスクにおいて、既存の汎用モデルを上回る性能を発揮することは、企業がAIを導入する際の具体的なメリットを示しています。機密性の高いデータを扱う企業にとって、オンプレミス環境での運用が可能な軽量モデルは、セキュリティ面での懸念を払拭し、AI活用を加速させる大きな要因となるでしょう。今後は、この技術がどのようにビジネス現場に浸透し、具体的な業務効率化やコスト削減に貢献していくかが焦点となります。
「AIニュースは追っているけど、何から学べばいいか分からない…」 そんな初心者向けに、編集部が本当におすすめできる無料AIセミナーを厳選しました。
- 完全無料で参加できるAIセミナーだけを厳選
- ChatGPT・Geminiを基礎から体系的に学べる
- 比較しやすく、あなたに合う講座が一目で分かる
ChatGPTなどの生成AIを使いこなして、仕事・収入・時間の安定につながるスキルを身につけませんか?
AI Workstyle LabのAIニュースをチェックしているあなたは、すでに一歩リードしている側です。あとは、 実務で使える生成AIスキルを身につければ、「知っている」から「成果を出せる」状態へ一気に飛べます。
講師:栗須俊勝(AI総研)
30社以上にAI研修・業務効率化支援を提供。“大阪の生成AIハカセ”として企業DXを牽引しています。
- 日々の業務を30〜70%時短する、実務直結の生成AI活用法を体系的に学べる
- 副業・本業どちらにも活かせる、AI時代の「稼ぐためのスキルセット」を習得
- 文章・画像・資料作成など、仕事も趣味もラクになる汎用的なAIスキルが身につく
ニュースを読むだけで終わらせず、
「明日から成果が変わるAIスキル」を一緒に身につけましょう。
本記事は、各社の公式発表および公開情報を基に、AI Workstyle Lab編集部が 事実確認・再構成を行い作成しています。一次情報の内容は編集部にて確認し、 CoWriter(AI自動生成システム)で速報性を高めつつ、最終的な編集プロセスを経て公開しています。

