怪談系テーマの朗読音声データセットの概要
本データセットは、怪談や怖い話といった物語性のある日本語テキストを題材に、日本人話者が一人で朗読する音声と、その発話内容を忠実に書き起こしたトランスクリプト(文字起こしテキスト)で構成されています。物語の進行に伴い、不安感や緊張感を含む語り口が自然に表出する朗読音声が収録されており、読み上げ調の音声に加えて、感情を伴う連続発話としての音声表現を含んでいます。
怪談というテーマの特性上、抑揚や間、声のトーン変化が文脈と密接に結びついています。これにより、単文単位の音声認識にとどまらず、長文のコンテキストを前提とした音声理解や言語モデル(LLM)の学習に利用しやすい構成となっているのが特徴です。また、1話者による朗読形式であるため、話者分離を前提としないモデル検証や、話者条件を固定した音声・言語挙動の分析にも適しています。
Qlean Datasetでは、研究用途から商用展開を見据えたAI開発までを想定し、データの権利関係や利用条件を整理したうえで、実運用に耐える学習用データを提供しています。本データセットも、音声・言語系AI開発の現場における検証・評価・学習フェーズでの活用を想定してデータ設計されており、Qlean Datasetが提供するオリジナルデータラインナップ「AIデータレシピ」の一つとして提供されます。
データセットの詳細
| データ種別 | 音声、テキスト |
|---|---|
| 被写体属性 | 日本人 |
| データ形式 | 音声データ:mp3 |
| 収録時間 | 1音声30秒〜90分 |
| 音声レート | 44.1kHz / 48kHz |
| 対象のシーン | ・怪談やホラー作品の文章を、一人の話者が感情を込めて朗読するシーン ・不安感や緊張感を伴う語り口で物語が進行する朗読シーン |
サンプル詳細はこちらで確認できます。
https://qleandataset.visual-bank.co.jp/lineup/pn-039
ユースケースイメージ
研究用途
-
長文音声入力に対する音声認識・音声理解モデルの評価
怪談朗読に含まれる連続的な語りを用い、ASRモデルにおける長文発話の認識精度や、文脈継続時の誤認識傾向を検証する研究に利用できます。 -
音声入力を起点とした言語モデルの文脈理解検証
音声認識結果を入力とするLLMや音声理解モデルに対し、物語文脈の保持や内容理解の挙動を評価する用途に利用できます。
産業用途
-
音声対話AI・ナレーション生成AIの検証用データ
怪談朗読に含まれる抑揚や間を含んだ音声表現を用い、音声対話AIや音声生成AIにおける入力理解や出力品質の検証に利用できます。 -
コールセンター・音声UI向け音声処理モデルの事前検証
感情を含む連続発話音声を用いて、音声UIや音声処理基盤における認識安定性や誤動作リスクの検証用途に利用できます。
『Qlean Dataset(キュリンデータセット)』について
『Qlean Dataset』は、Visual Bank傘下の株式会社アマナイメージズが提供する商用利用可能なAI学習用データソリューションです。画像・動画・音声・3D・テキストなど、多様な形式のデータに対応し、研究・商用いずれの用途でも安全に利用できる環境を整備しています。
また、株式会社千葉ロッテマリーンズや株式会社東洋経済新報社をはじめとするデータパートナーとの協業を通じ、業界特化・最新トレンドに即したデータラインナップ『AIデータレシピ』を継続的に拡充しています。
Qlean Datasetは、AI開発現場におけるデータ収集・整備の負荷を軽減し、権利クリアで法的リスクのないAI開発環境の構築を支援します。

-
Qlean Datasetサイト: https://qleandataset.visual-bank.co.jp/
Visual Bank株式会社について
Visual Bank株式会社は、AI開発力を最大化する次世代型データインフラを構築・提供するスタートアップ企業として、「あらゆるデータの可能性を解き放つ」をミッションに掲げ事業活動を展開しています。漫画家の「もっと描きたい!」をサポートするAI補助ツールを提供する『THE PEN』の他、AI学習用データセット開発サービス『Qlean Dataset(キュリンデータセット)』を提供する株式会社アマナイメージズを100%子会社に持ちます。
また、Visual Bankは国の研究開発プログラム「GENIAC」にも採択され、社会実装に向けた取り組みを加速させています。
-
Visual Bank企業URL: https://visual-bank.co.jp/
-
アマナイメージズ企業URL: https://amanaimages.com/about/
AI Workstyle Lab編集部コメント
この怪談系朗読音声データは、特に音声対話AIやナレーション生成AIの開発において、大きなビジネス的価値をもたらすと考えられます。感情の機微を伴う自然な発話は、ユーザー体験を向上させる対話型AIの精度向上に直結するでしょう。また、コールセンターなどでの音声UIでは、感情を伴う多様な発話への対応能力を高めることで、誤認識リスクの低減や顧客満足度の向上に貢献します。これにより、ビジネスにおける音声AIの活用範囲がさらに広がり、より人間らしいコミュニケーションが実現されることが期待されます。
「AIニュースは追っているけど、何から学べばいいか分からない…」 そんな初心者向けに、編集部が本当におすすめできる無料AIセミナーを厳選しました。
- 完全無料で参加できるAIセミナーだけを厳選
- ChatGPT・Geminiを基礎から体系的に学べる
- 比較しやすく、あなたに合う講座が一目で分かる
ChatGPTなどの生成AIを使いこなして、仕事・収入・時間の安定につながるスキルを身につけませんか?
AI Workstyle LabのAIニュースをチェックしているあなたは、すでに一歩リードしている側です。あとは、 実務で使える生成AIスキルを身につければ、「知っている」から「成果を出せる」状態へ一気に飛べます。
講師:栗須俊勝(AI総研)
30社以上にAI研修・業務効率化支援を提供。“大阪の生成AIハカセ”として企業DXを牽引しています。
- 日々の業務を30〜70%時短する、実務直結の生成AI活用法を体系的に学べる
- 副業・本業どちらにも活かせる、AI時代の「稼ぐためのスキルセット」を習得
- 文章・画像・資料作成など、仕事も趣味もラクになる汎用的なAIスキルが身につく
ニュースを読むだけで終わらせず、
「明日から成果が変わるAIスキル」を一緒に身につけましょう。
本記事は、各社の公式発表および公開情報を基に、AI Workstyle Lab編集部が 事実確認・再構成を行い作成しています。一次情報の内容は編集部にて確認し、 CoWriter(AI自動生成システム)で速報性を高めつつ、最終的な編集プロセスを経て公開しています。

