高品質なデータでAI開発を支援
本データセットは、事前に用意された台本に基づいているため、文構造や語彙の対応関係が明確です。また、一話者による朗読形式で収録されているため、自然発話に見られる言い直しや話題の逸脱が抑えられています。これにより、音声とテキストの対応付けが求められる音声認識モデルの学習や評価、音声入力を前提とした言語処理パイプラインの検証など、基礎的な音声言語処理タスクに利用しやすい構成となっています。
Qlean Datasetは、研究用途から商用利用を前提としたAI開発までを見据え、権利処理や利用条件を整理したデータ提供を行っています。このデータセットも、日本語音声と言語情報の対応関係を扱うAI開発・検証環境の整備を目的として提供されます。
「日本語・1話者・台本朗読音声コーパスとトランスクリプト」の概要
| データ種別 | 音声、テキスト |
|---|---|
| 被写体属性 | 日本人、男性 |
| データ形式 | 音声データ:mp3 テキストデータ:txt,json,csv |
| 音声レート | 44.1kHz / 48kHz |
| サンプル詳細 | https://qleandataset.visual-bank.co.jp/lineup/pn-010 |
ユースケースイメージ
-
研究用途
- 日本語ASRモデルの基礎評価:音声とテキストの対応関係を明確に扱い、ASRモデルの認識精度や誤り傾向を検証できます。
-
産業用途
- 音声入力を含むLLM・音声言語処理パイプラインの検証:音声入力をテキストに変換する前段処理や、音声認識結果を言語モデルに接続する処理フローの検証に活用できます。
-
その他実需要
- 音声言語処理システムの学習・評価用データ:音声認識や音声テキスト変換の仕組みを学ぶ教育用途や、既存モデルの動作確認・比較検証のための評価用データとして利用できます。
『Qlean Dataset(キュリンデータセット)』について
『Qlean Dataset』は、Visual Bank傘下の株式会社アマナイメージズが提供する、商用利用可能なAI学習用データソリューションです。画像・動画・音声・3D・テキストなど多様な形式のデータに対応し、研究・商用いずれの用途でも安全に利用できる環境を整備しています。

株式会社千葉ロッテマリーンズや株式会社東洋経済新報社をはじめとするデータパートナーとの協業を通じて、業界特化・最新トレンドに即したデータラインナップ『AIデータレシピ』を継続的に拡充しています。

Qlean Datasetは、AI開発現場におけるデータ収集・整備の負荷を軽減し、権利クリアで法的リスクのないAI開発環境の構築を支援しています。

『Qlean Dataset』の提供するデータセット『AIデータレシピ』の特徴
-
すべての被写体から同意取得済みです。
-
既存データは最短1日で納品可能です。
-
カスタム撮影・収録・収集による独自データ構築にも対応しています。

Visual Bank株式会社について
Visual Bank株式会社は、「あらゆるデータの可能性を解き放つ」をミッションに掲げ、AI開発力を最大化する次世代型データインフラを構築・提供するスタートアップ企業です。漫画家向けのAI補助ツール『THE PEN』の提供や、AI学習用データセット開発サービス『Qlean Dataset』を提供する株式会社アマナイメージズを100%子会社に持っています。また、国の研究開発プログラム「GENIAC」にも採択されており、社会実装に向けた取り組みを加速させています。
-
Qlean Datasetサイト:https://qleandataset.visual-bank.co.jp/
-
Visual Bank企業URL:https://visual-bank.co.jp/
-
アマナイメージズ企業URL:https://amanaimages.com/about/
「AIニュースは追っているけど、何から学べばいいか分からない…」 そんな初心者向けに、編集部が本当におすすめできる無料AIセミナーを厳選しました。
- 完全無料で参加できるAIセミナーだけを厳選
- ChatGPT・Geminiを基礎から体系的に学べる
- 比較しやすく、あなたに合う講座が一目で分かる
ChatGPTなどの生成AIを使いこなして、仕事・収入・時間の安定につながるスキルを身につけませんか?
AI Workstyle LabのAIニュースをチェックしているあなたは、すでに一歩リードしている側です。あとは、 実務で使える生成AIスキルを身につければ、「知っている」から「成果を出せる」状態へ一気に飛べます。
講師:栗須俊勝(AI総研)
30社以上にAI研修・業務効率化支援を提供。“大阪の生成AIハカセ”として企業DXを牽引しています。
- 日々の業務を30〜70%時短する、実務直結の生成AI活用法を体系的に学べる
- 副業・本業どちらにも活かせる、AI時代の「稼ぐためのスキルセット」を習得
- 文章・画像・資料作成など、仕事も趣味もラクになる汎用的なAIスキルが身につく
ニュースを読むだけで終わらせず、
「明日から成果が変わるAIスキル」を一緒に身につけましょう。
本記事は、各社の公式発表および公開情報を基に、AI Workstyle Lab編集部が 事実確認・再構成を行い作成しています。一次情報の内容は編集部にて確認し、 CoWriter(AI自動生成システム)で速報性を高めつつ、最終的な編集プロセスを経て公開しています。

