
CLASI
高质量、类人同声传译系统
- 采用数据驱动的读写策略,平衡翻译质量和延迟。
- 多模态检索模块,增强特定领域术语的翻译。
- 利用大型语言模型(LLMs)生成容错翻译。
- 考虑输入音频、历史上下文和检索信息进行翻译。
- 在真实世界场景中,有效信息比例(VIP)显著高于其他系统。
- 支持中文到英文和英文到中文的翻译方向。
产品详情
CLASI是一个由字节跳动研究团队开发的高质量、类人同声传译系统。它通过新颖的数据驱动读写策略平衡翻译质量和延迟,采用多模态检索模块来增强特定领域术语的翻译,利用大型语言模型(LLMs)生成容错翻译,考虑输入音频、历史上下文和检索信息。在真实世界场景中,CLASI在中英和英中翻译方向上分别达到了81.3%和78.0%的有效信息比例(VIP),远超其他系统。