阿里通义语音双模型 Fun-CosyVoice3.5 与 Fun-AudioGen-VD 发布

AI 资讯快报  • 2026-03-04 09:371次浏览
通义实验室发布两款语音生成模型与,首创FreeStyle指令控制范式,用户可通过自然语言描述语气、情绪、场景等细节,无需依赖固定标签。Fun-CosyVoice3.5支持多语种复刻与精细化表达控制,新增泰语、印尼语等4个小语种,生僻字读错率降至5.3%;Fun-AudioGen-VD则实现端到端声音设计,可生成角色化音色并模拟环境声学效果。 更多详情...