通义百聆语音双子星,同步开源!

AI 资讯快报  • 2026-12-16 00:001次浏览
阿里云通义百聆开源语音双子星模型与。Fun-CosyVoice3支持仅3秒音频即可实现跨9种语言、18种方言的音色克隆与情感控制,首包延迟降低50%,中英混说错误率下降56.4%。Fun-ASR在嘈杂环境下识别准确率达93%,支持31种语言混说及方言识别,将流式识别首字延迟降至160毫秒。 更多详情...