動画で簡単AI自動化!カラクリ開発の国産AI「KARAKURI VL2」がPC業務を劇的に効率化

📰 AIニュース

開発背景:コンタクトセンターの業務課題を解決

国内のコンタクトセンター市場は約1兆円規模とされ、CRMやメール、チャット、社内ナレッジなど複数のツールを日常的に使い分けて業務にあたっています。定型的なPC操作を自動化するRPAツールはすでに存在しますが、導入にはエンジニアによるシナリオ構築やAPI連携の設定が不可欠であり、現場主導での自動化は困難な状況が続いていました。

カラクリは、「新人に教えるように、AIに教える」というコンセプトのもと、プログラミング知識がなくても業務動画を撮影するだけで自動化を始められるAIアプリケーションを開発しました。

「動画を撮るだけ」の3ステップで業務を自動化

このAIアプリケーションは、以下のシンプルな3ステップで業務自動化を実現します。

業務プロセスをAIで自動化する3ステップ

  1. 業務を撮影する: 自動化したい業務を画面録画しながら、口頭で操作内容を説明します。新人スタッフに教えるのと同じ感覚で、普段どおりの操作を行うだけです。
  2. マニュアルを自動生成する: Google社のGeminiが撮影された動画を解析し、操作手順書を自動作成します。動画内の画面遷移と音声による説明を統合的に理解し、再現可能な手順書へと変換します。
  3. AIが業務を自律実行する: カラクリ独自開発の国産視覚言語モデル「KARAKURI VL2」が、生成された手順書に基づきPC画面を認識しながら操作を自律的に実行します。

初期設定に必要な時間は、業務動画の撮影とアップロードを含めて約15分とされています。

TENTIALでの実証実験:15分の設定で年間200時間削減

株式会社TENTIALとの実証実験では、カスタマーサポートにおける「お問い合わせの振り分け作業」を対象に検証が行われました。その結果、業務動画の撮影・アップロードという約15分の初期設定で、年間約200時間の業務削減効果が確認されています。

技術構成:複数のAI技術を最適に組み合わせるアーキテクチャ

本アプリケーションは、カラクリが設計・開発したソリューションであり、各工程に最適なAI技術を組み合わせて構成されています。

工程 担当技術 役割
マニュアル自動生成 Google Gemini 動画の解析および操作手順書の自動作成
PC操作の自律実行 KARAKURI VL2 手順書に基づくPC画面の認識と操作の自律実行
アプリケーション全体 カラクリ ソリューション設計・開発・UI構築

KARAKURI VL2の主な特長

  • 経済産業省GENIAC第3期の採択を受けてカラクリが開発した国産視覚言語モデルです。

  • 8B(80億)パラメータの軽量設計により、ローカル環境での動作が可能です。

  • PC画面を認識し、操作を自律的に実行する能力を保有しています。

  • 機密データを外部に送信せずに運用できるため、セキュリティ要件の厳しい環境にも対応できます。

今後の展望

カラクリは、KARAKURI VL2を基盤としたAIエージェントアプリケーションのサービス化を推進していく方針です。カスタマーサポート領域を起点に、レガシーシステムを含む複数アプリケーション間の操作自動化へと対象を拡大し、「人に教えるようにAIに教える」ことであらゆるPC業務を自動化できる世界の実現を目指しています。

カラクリ株式会社について

カラクリ株式会社は「FriendlyTechnology」をビジョンに掲げ、大規模言語モデル(LLM)のカスタマーサポートへの実用化を目指すAIスタートアップです。2018年からトランスフォーマーモデルであるBERTの研究を開始し、2022年からはGPTを含む大規模言語モデルの研究に取り組んでいます。同社が提供するカスタマーサポート向けAIシリーズは、高島屋、SBI証券、セブン-イレブン・ジャパン、星野リゾートなど、各業界のトップ企業に導入されています。

AI Workstyle Lab編集部コメント

今回のカラクリによる国産AI「KARAKURI VL2」の発表は、ビジネスにおけるAI活用において非常に重要な意味を持ちます。特に、プログラミング知識が不要で「動画を撮るだけ」という手軽さは、これまでRPA導入に踏み切れなかった中小企業や部門単位での業務改善を強力に後押しするでしょう。コンタクトセンターだけでなく、経理・人事といったバックオフィス業務、あるいは営業事務など、定型的なPC操作が多いあらゆる職種での効率化が期待されます。現場の従業員が自ら業務を自動化できる環境が整うことで、企業全体の生産性向上、ひいては収益改善に直結する可能性を秘めていると言えるでしょう。この技術が、さらに多くのビジネスシーンで活用される未来に注目しています。

📘 もっと基礎から学びたい人へ|無料で参加できるAIセミナーまとめ

「AIニュースは追っているけど、何から学べばいいか分からない…」 そんな初心者向けに、編集部が本当におすすめできる無料AIセミナーを厳選しました。

🔰【初心者向け】生成AIを基礎から学べる無料セミナーまとめ
  • 完全無料で参加できるAIセミナーだけを厳選
  • ChatGPT・Geminiを基礎から体系的に学べる
  • 比較しやすく、あなたに合う講座が一目で分かる
無料で学べるAIセミナー一覧を見る
生成AI学習に取り残されないために…
ChatGPTなどの生成AIを使いこなして、仕事・収入・時間の安定につながるスキルを身につけませんか?

AI Workstyle LabのAIニュースをチェックしているあなたは、すでに一歩リードしている側です。あとは、 実務で使える生成AIスキルを身につければ、「知っている」から「成果を出せる」状態へ一気に飛べます。

ChatGPT無料セミナー|ゼロから2時間で学べる生成AI活用講座
PR|生成AIスクール
🧠 実践型 生成AIスクール「スタートAI」

講師:栗須俊勝(AI総研)
30社以上にAI研修・業務効率化支援を提供。“大阪の生成AIハカセ”として企業DXを牽引しています。

  • 日々の業務を30〜70%時短する、実務直結の生成AI活用法を体系的に学べる
  • 副業・本業どちらにも活かせる、AI時代の「稼ぐためのスキルセット」を習得
  • 文章・画像・資料作成など、仕事も趣味もラクになる汎用的なAIスキルが身につく

ニュースを読むだけで終わらせず、
「明日から成果が変わるAIスキル」を一緒に身につけましょう。

【編集ポリシー】

本記事は、各社の公式発表および公開情報を基に、AI Workstyle Lab編集部が 事実確認・再構成を行い作成しています。一次情報の内容は編集部にて確認し、 CoWriter(AI自動生成システム)で速報性を高めつつ、最終的な編集プロセスを経て公開しています。

【初心者向け】
生成AIスクール
無料セミナー比較

独学に限界を感じたら。実務で使えるAIスキルを最短で。
まずは無料セミナーで「自分に合う学び方」を見つけましょう。

無料セミナーを見る
※比較記事・体験談つき。学び方で迷う人ほど相性◎
この記事には一部PRが含まれます

本記事は筆者の実体験・一次情報をもとに作成していますが、一部にアフィリエイトリンク(PR)が含まれています。

記事内容や評価は、PR有無に関わらず筆者の正直な見解です。

この記事の情報
記事の著者
AI Workstyle Lab 編集部

ChatGPTやAIツールを中心に、AI時代の「学び・働き方・キャリア」をアップデートする情報を発信。
AI Workstyle Labは、AIと共に進化する働き方を提案するメディアです。
AI Workstyle Lab編集部は、人間の編集者が監修し、150本以上の記事をChatGPT × 校正AIで制作しています。

AI Workstyle Lab 編集部をフォローする
📰 AIニュース
スポンサーリンク
AI Workstyle Lab 編集部をフォローする
タイトルとURLをコピーしました