Emilia

Emilia

大规模多语种语音生成数据集

提供超过101,000小时的六种语言高质量语音数据
包含中文、英文、日文、韩文、德文和法文的语音和文本转录
源自互联网上多样化的视频平台和播客，内容类型丰富
支持使用Emilia-Pipe开源预处理管道进行数据预处理
允许研究者下载原始音频文件并重建数据集
Emilia-Pipe支持自定义语音数据的预处理，以满足特定研究需求

产品详情

Emilia是一个开源的多语种野外语音数据集，专为大规模语音生成研究设计。它包含超过101,000小时的六种语言高质量语音数据和相应的文本转录，覆盖了各种说话风格和内容类型，如脱口秀、访谈、辩论、体育评论和有声书。

相关项目

Udio v1.5

Udio v1.5

问问小宇宙

问问小宇宙

Speech to Note

Speech to Note

SpeechGPT2

SpeechGPT2