
StreamVC
实时低延迟语音转换技术
- 实时低延迟语音转换
- 保持源语音内容和韵律
- 匹配目标语音的音色
- 适用于移动平台
- 适用于实时通信场景
- 使用SoundStream神经音频编解码器架构
- 学习软语音单元的因果性
- 提供白化基频信息以提高音高稳定性
产品详情
StreamVC是由Google研发的实时低延迟语音转换解决方案,能够在保持源语音内容和韵律的同时,匹配目标语音的音色。该技术特别适合实时通信场景,如电话和视频会议,并且可用于语音匿名化等用例。StreamVC利用SoundStream神经音频编解码器的架构和训练策略,实现轻量级高质量的语音合成。它还展示了学习软语音单元的因果性以及提供白化基频信息以提高音高稳定性而不泄露源音色信息的有效性。