
CosyVoice
多语言大型语音生成模型,提供全栈推理、训练和部署能力。
- 支持多种语言的语音生成,包括但不限于中文、英文、日语、粤语和韩语。
- 提供零样本(zero-shot)、跨语言(cross-lingual)和指令式(instruct)推理能力。
- 支持声音风格转换(SFT)技术,能够模仿特定的声音风格。
- 提供完整的训练脚本和推理脚本,方便用户进行模型训练和使用。
- 支持通过Web界面进行快速演示和体验。
- 支持使用 Docker 进行模型部署,方便在不同环境中使用。
产品详情
CosyVoice 是一个多语言的大型语音生成模型,它不仅支持多种语言的语音生成,还提供了从推理到训练再到部署的全栈能力。该模型在语音合成领域具有重要性,因为它能够生成自然流畅、接近真人的语音,适用于多种语言环境。CosyVoice 的背景信息显示,它是由 FunAudioLLM 团队开发,使用了 Apache-2.0 许可证。