205時間日本語話者分離自然会話データセット
このデータセットは、実環境の対話を再現することを目指して開発されました。話者分離モデル、音声アシスタント、カスタマーセンター分析、自然な対話モデルなどの開発に活用できます。
特徴とメリット:
-
実機収録による汎用性: スマートフォンで収録されており、ノイズキャンセルや圧縮など、実際のユーザー環境に近い音響特性を持っています。
-
話者分離・双方向対応: 2名の話者を別トラックで収録しているため、会話中の割り込みや発話の重なりもすべて記録され、対話システム開発に必要な情報を確実に収録しています。
-
多様な話者属性: 合計234名(男性102名・女性132名)が参加しており、年齢層も18歳から60歳まで幅広くカバーしているため、バイアスの少ないデータ構築が可能です。
-
高精度アノテーション: 文字認識精度98%以上で、タイムスタンプ、話者ID、性別情報が付与されており、発話区間の特定が容易です。
詳細はこちら:205時間日本語話者分離自然会話データセット
100時間日本語エンティティ読み上げデータセット
音声認識において特に精度が求められやすい「固有表現(名前、住所、金額など)」に特化したデータセットです。音声入力フォーム、NER(固有表現認識)、個人情報抽出などの活用シーンが想定されます。
特徴とメリット:
-
豊富なエンティティタグ: 人物名、電話番号、住所、メールアドレス、商品モデル番号、金額など、ビジネスシーンで重要な要素がそれぞれタグ付け(例:[PHO], [LOC], [MONEY])されています。
-
実環境ノイズの包含: 完全な無音環境だけでなく、「認識に影響しない程度のノイズ」を含む環境も混在しており、モデルのロバスト性(頑健性)向上に寄与します。
-
スマートフォン収録: 実際のモバイル端末での利用を想定した音質設定(16kHz)であり、モバイルアプリ開発との親和性が高いです。
-
構造化された転写: 単なる文字起こしだけでなく、どこがどのエンティティかが明確になっているため、後処理のコストを大幅に削減できます。
詳細はこちら:100時間日本語エンティティ読み上げデータセット
48kHz500時間日本語話者分離会話音声データセット
「量」と「質」の両立を求める開発者向けの大規模データセットです。高精度音声認識基盤モデル、研究開発、プロフェッショナル向けサービスなどの開発に適しています。
特徴とメリット:
-
プロフェッショナル音質: 48kHzサンプリング、32bit深度という高音質フォーマットを採用しており、高精度な話者認識など繊細な音響処理を必要とするプロジェクトに最適です。
-
大規模コーパス: 有効時間500時間という大容量のため、深層学習モデルの事前学習(Pre-training)や、汎用性能の向上に大きく貢献します。
-
詳細なアノテーション仕様: 不適切な発話やノイズ、プライバシー情報(電話番号など)には[IVS], [PIL]などのタグが付与されており、データクレンジングが容易です。
詳細はこちら:48kHz500時間日本語話者分離会話音声データセット
多言語音声データセットとNexdataの取り組み
Nexdataは、日本語だけでなく、英語、韓国語、タイ語などアジア言語、ヨーロッパ言語を含む60以上の言語、総計100万時間超の多言語話者分離音声データセットも豊富に保有しています。新規収集・アノテーションに加え、既存データセットのカスタマイズ対応も可能で、最短1週間での納品にも対応しています。
すべてのデータセットは自社版権で提供されており、個人情報(電話番号、カード番号など)が含まれる箇所は[PIL]タグで明示され、音声ファイル側もマスク処理されているため、セキュリティリスクを懸念せずに利用できます。
Nexdataは2011年からAI開発向けの商用利用可能なデータセット販売・データ収集・アノテーションおよびデータ提供を行っており、現在約4.5PB規模の教師データを保有しています。音声、画像、動画、テキスト、点群など多様なデータセットを世界中のAI企業に供給することで、AI業界が抱える最大の課題である「データの質と量」の解決に貢献しています。
Datatang株式会社について
Datatang株式会社は、AI学習データ提供事業を展開する企業です。
-
社名: データ・タング株式会社(Datatang株式会社)
-
所在地: 東京都千代田区神田淡路町2-105ワテラスアネックス6階
-
設立: 2020年2月
-
資本金: 5000万円
-
事業概要: AI学習データ提供事業(自社データ・カスタマイズデータ)、AI学習データの収集・アノテーション・プラットフォーム提供事業
-
URL: https://nexdata.jp/
-
お問い合わせ: https://nexdata.jp/
AI Workstyle Lab編集部コメント
Nexdataが提供する高品質な日本語音声データセットは、ビジネスにおけるAI活用に大きな示唆を与えます。話者分離データは、コンタクトセンターでの顧客対応分析や会議議事録作成の効率化に直結し、エンティティ認識データは音声入力システムでの個人情報や重要情報の正確な抽出を可能にします。これらのデータセットは、AIモデルの精度向上を通じて、企業の業務効率化や新たなサービス開発を強力に後押しし、競争力強化に貢献するでしょう。特に、実環境に近いデータは開発現場での実用性を高めます。
「AIニュースは追っているけど、何から学べばいいか分からない…」 そんな初心者向けに、編集部が本当におすすめできる無料AIセミナーを厳選しました。
- 完全無料で参加できるAIセミナーだけを厳選
- ChatGPT・Geminiを基礎から体系的に学べる
- 比較しやすく、あなたに合う講座が一目で分かる
ChatGPTなどの生成AIを使いこなして、仕事・収入・時間の安定につながるスキルを身につけませんか?
AI Workstyle LabのAIニュースをチェックしているあなたは、すでに一歩リードしている側です。あとは、 実務で使える生成AIスキルを身につければ、「知っている」から「成果を出せる」状態へ一気に飛べます。
講師:栗須俊勝(AI総研)
30社以上にAI研修・業務効率化支援を提供。“大阪の生成AIハカセ”として企業DXを牽引しています。
- 日々の業務を30〜70%時短する、実務直結の生成AI活用法を体系的に学べる
- 副業・本業どちらにも活かせる、AI時代の「稼ぐためのスキルセット」を習得
- 文章・画像・資料作成など、仕事も趣味もラクになる汎用的なAIスキルが身につく
ニュースを読むだけで終わらせず、
「明日から成果が変わるAIスキル」を一緒に身につけましょう。
本記事は、各社の公式発表および公開情報を基に、AI Workstyle Lab編集部が 事実確認・再構成を行い作成しています。一次情報の内容は編集部にて確認し、 CoWriter(AI自動生成システム)で速報性を高めつつ、最終的な編集プロセスを経て公開しています。

