Emilia

Emilia

大规模多语种语音生成数据集

  • 提供超过101,000小时的六种语言高质量语音数据
  • 包含中文、英文、日文、韩文、德文和法文的语音和文本转录
  • 源自互联网上多样化的视频平台和播客,内容类型丰富
  • 支持使用Emilia-Pipe开源预处理管道进行数据预处理
  • 允许研究者下载原始音频文件并重建数据集
  • Emilia-Pipe支持自定义语音数据的预处理,以满足特定研究需求

产品详情

Emilia是一个开源的多语种野外语音数据集,专为大规模语音生成研究设计。它包含超过101,000小时的六种语言高质量语音数据和相应的文本转录,覆盖了各种说话风格和内容类型,如脱口秀、访谈、辩论、体育评论和有声书。