CosyVoice

多语言大型语音生成模型，提供全栈推理、训练和部署能力。

支持多种语言的语音生成，包括但不限于中文、英文、日语、粤语和韩语。
提供零样本（zero-shot）、跨语言（cross-lingual）和指令式（instruct）推理能力。
支持声音风格转换（SFT）技术，能够模仿特定的声音风格。
提供完整的训练脚本和推理脚本，方便用户进行模型训练和使用。
支持通过Web界面进行快速演示和体验。
支持使用 Docker 进行模型部署，方便在不同环境中使用。

产品详情

CosyVoice 是一个多语言的大型语音生成模型，它不仅支持多种语言的语音生成，还提供了从推理到训练再到部署的全栈能力。该模型在语音合成领域具有重要性，因为它能够生成自然流畅、接近真人的语音，适用于多种语言环境。CosyVoice 的背景信息显示，它是由 FunAudioLLM 团队开发，使用了 Apache-2.0 许可证。

CosyVoice

产品详情

相关项目

Udio v1.5

问问小宇宙

Speech to Note

SpeechGPT2