伝統話芸「講談」をAI学習データに
今回提供が開始されたデータセットは、日本の伝統話芸である講談の語りを対象としています。1名の話者による物語の音声と、その内容を忠実に書き起こした日本語トランスクリプトで構成されています。講談特有の抑揚、間、語りの速度変化を含む自然発話が連続的に収録されており、読み上げ音声や対話音声とは異なる、日本語の物語的発話構造を持つ点が特徴です。
物語の進行に伴い、情景説明、登場人物の語り分け、緊張感の演出といった要素が含まれるため、単調な発話データでは得られない検証環境を提供します。長尺から短尺まで多様な語り構成により、連続音声における文脈保持やセグメンテーション(音声の区切り)を伴う研究にも活用できるとされています。
Qlean Datasetでは、生成AI基盤モデル開発を含む研究・商用AI開発の現場で求められるデータ要件に基づき、権利処理および利用条件を整理した上で、本データセットを提供しています。Visual Bankは、今後も音声・言語領域における多様な日本語データの整備を通じて、AI開発および研究の基盤形成を支援していく方針です。
提供されるデータセットの概要
| データ種別 | 音声、テキスト |
|---|---|
| 被写体属性 | 日本人 |
| データ形式 | 音声データ:mp3、テキストデータ:txt,json,csv |
| 収録時間 | 1音声30秒〜45分 |
| 音声レート | 44.1kHz / 48kHz |
| 対象のシーン | ・講談特有の語り口で物語を語る音声シーン ・抑揚や間を活かしながら進行する語りのシーン |
サンプル詳細については、以下のリンクから確認できます。
ユースケースイメージ
【研究用途】
-
日本語音声認識モデルにおける自然発話精度検証
- ASRモデルの研究において、講談の語りに含まれる抑揚や間を伴う連続音声を用いることで、読み上げ音声とは異なる自然発話条件下での認識精度や誤認識傾向の検証に利用できます。
-
音声と言語表現の対応関係に関する研究
- 音声信号と書き起こしテキストを組み合わせ、日本語における語り表現の構造や韻律情報が言語理解に与える影響を分析する研究用途に利用できます。
【産業用途】
-
音声入力型AIにおける長尺音声処理の検証
- 音声検索や音声アーカイブ解析を行うAIプロダクト開発において、長時間の一人語り音声を用いた音声分割、全文書き起こし、要約処理などの機能検証に利用できます。
-
日本語音声言語モデルの事前学習・評価
- 日本語特有の語り口や物語構造を含む音声・テキストデータとして、音声言語モデルの事前学習や評価フェーズにおける補助データとして利用できます。
『Qlean Dataset(キュリンデータセット)』について
『Qlean Dataset』は、Visual Bank傘下の株式会社アマナイメージズが提供する、商用利用可能なAI学習用データソリューションです。画像・動画・音声・3D・テキストなど、多様な形式のデータに対応し、研究・商用いずれの用途でも安全に利用できる環境を整備しています。
また、株式会社千葉ロッテマリーンズや株式会社東洋経済新報社をはじめとするデータパートナーとの協業を通じて、業界特化・最新トレンドに即したデータラインナップ『AIデータレシピ』を継続的に拡充しています。Qlean Datasetは、AI開発現場におけるデータ収集・整備の負荷を軽減し、権利クリアで法的リスクのないAI開発環境の構築を支援しています。

『Qlean Dataset』の提供するデータセット『AIデータレシピ』の主な特徴
-
すべての被写体から同意取得
-
既存データは最短1日で納品可能
-
カスタム撮影・収録・収集による独自データ構築にも対応

関連リンク
-
Qlean Datasetサイト:https://qleandataset.visual-bank.co.jp/
Visual Bank株式会社について
Visual Bank株式会社は、「あらゆるデータの可能性を解き放つ」をミッションに掲げ、AI開発力を最大化する次世代型データインフラを構築・提供するスタートアップ企業です。漫画家の「もっと描きたい!」をサポートするAI補助ツール『THE PEN』の他、AI学習用データセット開発サービス『Qlean Dataset』を提供する株式会社アマナイメージズを100%子会社に持ちます。また、Visual Bankは国の研究開発プログラム「GENIAC」にも採択され、社会実装に向けた取り組みを加速させています。
-
代表取締役CEO:永井 真之
-
所在地:〒107-0062 東京都港区南青山7-1-7 C-Cube南青山ビル6F
-
Visual Bank企業URL:https://visual-bank.co.jp/
-
アマナイメージズ企業URL:https://amanaimages.com/about/
AI Workstyle Lab編集部コメント
今回の「講談音声コーパス」の提供は、特に日本語を扱うAI開発においてビジネスチャンスを広げる可能性を秘めています。自然な語り口のデータは、コールセンターの自動応答システムや、コンテンツ生成AIの表現力向上に直結するでしょう。単調な読み上げ音声では捉えきれなかった微妙なニュアンスをAIが理解することで、より人間らしい対話や物語生成が可能になり、顧客体験の向上や新たなエンターテイメント創出に寄与することが期待されます。これにより、AI導入による業務効率化だけでなく、これまでにない価値創造への道が開かれることでしょう。
「AIニュースは追っているけど、何から学べばいいか分からない…」 そんな初心者向けに、編集部が本当におすすめできる無料AIセミナーを厳選しました。
- 完全無料で参加できるAIセミナーだけを厳選
- ChatGPT・Geminiを基礎から体系的に学べる
- 比較しやすく、あなたに合う講座が一目で分かる
ChatGPTなどの生成AIを使いこなして、仕事・収入・時間の安定につながるスキルを身につけませんか?
AI Workstyle LabのAIニュースをチェックしているあなたは、すでに一歩リードしている側です。あとは、 実務で使える生成AIスキルを身につければ、「知っている」から「成果を出せる」状態へ一気に飛べます。
講師:栗須俊勝(AI総研)
30社以上にAI研修・業務効率化支援を提供。“大阪の生成AIハカセ”として企業DXを牽引しています。
- 日々の業務を30〜70%時短する、実務直結の生成AI活用法を体系的に学べる
- 副業・本業どちらにも活かせる、AI時代の「稼ぐためのスキルセット」を習得
- 文章・画像・資料作成など、仕事も趣味もラクになる汎用的なAIスキルが身につく
ニュースを読むだけで終わらせず、
「明日から成果が変わるAIスキル」を一緒に身につけましょう。
本記事は、各社の公式発表および公開情報を基に、AI Workstyle Lab編集部が 事実確認・再構成を行い作成しています。一次情報の内容は編集部にて確認し、 CoWriter(AI自動生成システム)で速報性を高めつつ、最終的な編集プロセスを経て公開しています。

