国産AIの新たな地平：カラクリ「KARAKURI VL2」が示す、特定業務特化型AIエージェントの未来とビジネスインパクト

「KARAKURI VL2」の主な成果とベンチマーク結果
技術的特長と開発背景
今後の展望とカラクリ株式会社について

「KARAKURI VL2」の主な成果とベンチマーク結果

「KARAKURI VL2」は、8Bパラメータの軽量モデルでありながら、特定の業務領域で高い精度を達成しました。特に、画像編集（GIMP）ではClaude Sonnet 4.6の約2倍のスコアを記録し、メール操作（Thunderbird）でも優位性を示しています。また、ベースモデルと比較すると、複数のアプリケーションを横断して操作する「multi_apps」カテゴリで約2.8倍のスコア向上を達成しました。

この評価には、カラクリが開発しオープンソースで公開した日本語PC操作ベンチマーク「OSWorld-JP v0.2」（100タスク）が用いられています。このベンチマークと学習済みモデルは、以下のURLで公開されており、第三者による再現性の検証や国内CUA研究の共通評価基盤としての活用が期待されます。

学習済みモデル：https://huggingface.co/karakuri-ai/karakuri-vl-2-8b-thinking-2603
ベンチマーク：https://github.com/karakuri-ai/OSWorld-JP

技術的特長と開発背景

「KARAKURI VL2」の技術的特長は以下の3点です。

ローカル環境で動作する軽量モデル: 8Bパラメータ設計により、企業のオンプレミス環境での動作が可能で、機密データをセキュアに扱えます。
合成データによる業務特化学習: 実際の業務操作パターンを合成データとして活用し、コンタクトセンターなどで日常的に行われる画像編集やメール操作といった特定業務で高精度を実現しました。
AWS Trainiumによる学習基盤: Qwen3-VLアーキテクチャのTrainium上での大規模学習は、公開事例が確認されていない取り組みです（2026年3月時点）。

今回の開発は、これまで英語環境に最適化されていたCUAモデルの課題と、先行して開発された32Bパラメータモデルの推論コストの高さに対応するために行われました。軽量化と日本語環境での評価基盤の整備を通じて、国内のCUA研究の発展に貢献することを目指しています。

今後の展望とカラクリ株式会社について

カラクリ株式会社は「FriendlyTechnology」をビジョンに掲げ、今回開発された「KARAKURI VL2」を基盤としたAIエージェントアプリケーションのサービス化を推進する予定です。カスタマーサポート領域を起点に、レガシーシステムを含む複数アプリケーション間の操作自動化へと対象を拡大し、自社製品群への統合を進めていくとしています。

ベンチマーク「OSWorld-JP」についても、タスク数の拡充と評価カテゴリの追加を進め、国内CUA研究における標準的な評価基盤としての発展を目指す方針です。また、学習データの拡充とファインチューニング手法の改善により継続的に精度向上に取り組む予定です。

カラクリ株式会社の最高プロダクト責任者（CPO）である中山智文氏からは、以下のようなコメントが寄せられています。

「日本の産業を支えてきた『現場の磨き上げ（現場力）』をAIの知性に変えることを目指しています。今回の開発では、『業界特化』、『独自データ』、『自前運用』の3つの領域に特化しました。総合性能では海外大手モデルに差があるものの、現場の実務で使われる特定のアプリケーション操作に絞れば、8Bの軽量モデルでも十分な精度が出せることを確認できました。」

カラクリ株式会社に関する詳細は、以下のURLから確認できます。

カラクリ株式会社：https://karakuri.ai/

AI Workstyle Lab編集部コメント

カラクリが開発した「KARAKURI VL2」は、特定の業務領域に特化することで、軽量ながらも高い実用性を実現した点で注目に値します。特に、画像編集やメール操作といった現場で頻繁に行われるタスクにおいて、既存の汎用モデルを上回る性能を発揮することは、企業がAIを導入する際の具体的なメリットを示しています。機密性の高いデータを扱う企業にとって、オンプレミス環境での運用が可能な軽量モデルは、セキュリティ面での懸念を払拭し、AI活用を加速させる大きな要因となるでしょう。今後は、この技術がどのようにビジネス現場に浸透し、具体的な業務効率化やコスト削減に貢献していくかが焦点となります。

📘 もっと基礎から学びたい人へ｜無料で参加できるAIセミナーまとめ

「AIニュースは追っているけど、何から学べばいいか分からない…」そんな初心者向けに、編集部が本当におすすめできる無料AIセミナーを厳選しました。

🔰【初心者向け】生成AIを基礎から学べる無料セミナーまとめ