開発背景:コンタクトセンターの業務課題を解決
国内のコンタクトセンター市場は約1兆円規模とされ、CRMやメール、チャット、社内ナレッジなど複数のツールを日常的に使い分けて業務にあたっています。定型的なPC操作を自動化するRPAツールはすでに存在しますが、導入にはエンジニアによるシナリオ構築やAPI連携の設定が不可欠であり、現場主導での自動化は困難な状況が続いていました。
カラクリは、「新人に教えるように、AIに教える」というコンセプトのもと、プログラミング知識がなくても業務動画を撮影するだけで自動化を始められるAIアプリケーションを開発しました。
「動画を撮るだけ」の3ステップで業務を自動化
このAIアプリケーションは、以下のシンプルな3ステップで業務自動化を実現します。

- 業務を撮影する: 自動化したい業務を画面録画しながら、口頭で操作内容を説明します。新人スタッフに教えるのと同じ感覚で、普段どおりの操作を行うだけです。
- マニュアルを自動生成する: Google社のGeminiが撮影された動画を解析し、操作手順書を自動作成します。動画内の画面遷移と音声による説明を統合的に理解し、再現可能な手順書へと変換します。
- AIが業務を自律実行する: カラクリ独自開発の国産視覚言語モデル「KARAKURI VL2」が、生成された手順書に基づきPC画面を認識しながら操作を自律的に実行します。
初期設定に必要な時間は、業務動画の撮影とアップロードを含めて約15分とされています。
TENTIALでの実証実験:15分の設定で年間200時間削減
株式会社TENTIALとの実証実験では、カスタマーサポートにおける「お問い合わせの振り分け作業」を対象に検証が行われました。その結果、業務動画の撮影・アップロードという約15分の初期設定で、年間約200時間の業務削減効果が確認されています。
技術構成:複数のAI技術を最適に組み合わせるアーキテクチャ
本アプリケーションは、カラクリが設計・開発したソリューションであり、各工程に最適なAI技術を組み合わせて構成されています。
| 工程 | 担当技術 | 役割 |
|---|---|---|
| マニュアル自動生成 | Google Gemini | 動画の解析および操作手順書の自動作成 |
| PC操作の自律実行 | KARAKURI VL2 | 手順書に基づくPC画面の認識と操作の自律実行 |
| アプリケーション全体 | カラクリ | ソリューション設計・開発・UI構築 |
KARAKURI VL2の主な特長
-
経済産業省GENIAC第3期の採択を受けてカラクリが開発した国産視覚言語モデルです。
-
8B(80億)パラメータの軽量設計により、ローカル環境での動作が可能です。
-
PC画面を認識し、操作を自律的に実行する能力を保有しています。
-
機密データを外部に送信せずに運用できるため、セキュリティ要件の厳しい環境にも対応できます。
今後の展望
カラクリは、KARAKURI VL2を基盤としたAIエージェントアプリケーションのサービス化を推進していく方針です。カスタマーサポート領域を起点に、レガシーシステムを含む複数アプリケーション間の操作自動化へと対象を拡大し、「人に教えるようにAIに教える」ことであらゆるPC業務を自動化できる世界の実現を目指しています。
カラクリ株式会社について
カラクリ株式会社は「FriendlyTechnology」をビジョンに掲げ、大規模言語モデル(LLM)のカスタマーサポートへの実用化を目指すAIスタートアップです。2018年からトランスフォーマーモデルであるBERTの研究を開始し、2022年からはGPTを含む大規模言語モデルの研究に取り組んでいます。同社が提供するカスタマーサポート向けAIシリーズは、高島屋、SBI証券、セブン-イレブン・ジャパン、星野リゾートなど、各業界のトップ企業に導入されています。
-
会社URL: https://about.karakuri.ai/
-
関連リンク: https://karakuri.ai/
AI Workstyle Lab編集部コメント
今回のカラクリによる国産AI「KARAKURI VL2」の発表は、ビジネスにおけるAI活用において非常に重要な意味を持ちます。特に、プログラミング知識が不要で「動画を撮るだけ」という手軽さは、これまでRPA導入に踏み切れなかった中小企業や部門単位での業務改善を強力に後押しするでしょう。コンタクトセンターだけでなく、経理・人事といったバックオフィス業務、あるいは営業事務など、定型的なPC操作が多いあらゆる職種での効率化が期待されます。現場の従業員が自ら業務を自動化できる環境が整うことで、企業全体の生産性向上、ひいては収益改善に直結する可能性を秘めていると言えるでしょう。この技術が、さらに多くのビジネスシーンで活用される未来に注目しています。
「AIニュースは追っているけど、何から学べばいいか分からない…」 そんな初心者向けに、編集部が本当におすすめできる無料AIセミナーを厳選しました。
- 完全無料で参加できるAIセミナーだけを厳選
- ChatGPT・Geminiを基礎から体系的に学べる
- 比較しやすく、あなたに合う講座が一目で分かる
ChatGPTなどの生成AIを使いこなして、仕事・収入・時間の安定につながるスキルを身につけませんか?
AI Workstyle LabのAIニュースをチェックしているあなたは、すでに一歩リードしている側です。あとは、 実務で使える生成AIスキルを身につければ、「知っている」から「成果を出せる」状態へ一気に飛べます。
講師:栗須俊勝(AI総研)
30社以上にAI研修・業務効率化支援を提供。“大阪の生成AIハカセ”として企業DXを牽引しています。
- 日々の業務を30〜70%時短する、実務直結の生成AI活用法を体系的に学べる
- 副業・本業どちらにも活かせる、AI時代の「稼ぐためのスキルセット」を習得
- 文章・画像・資料作成など、仕事も趣味もラクになる汎用的なAIスキルが身につく
ニュースを読むだけで終わらせず、
「明日から成果が変わるAIスキル」を一緒に身につけましょう。
本記事は、各社の公式発表および公開情報を基に、AI Workstyle Lab編集部が 事実確認・再構成を行い作成しています。一次情報の内容は編集部にて確認し、 CoWriter(AI自動生成システム)で速報性を高めつつ、最終的な編集プロセスを経て公開しています。

