面壁智能 OpenBMB 发布 VoxCPM2 技术报告,2B 参数语音生成模型,基于超 200 万小时多语言数据训练,支持 30 种语言和 9 种中文方言。具备自然语言语音设计、可控及高保真延续性语音克隆能力,采用 16kHz 语义编码 + 48kHz 波形重建,在公开 TTS 基准上达到 SOTA 或极具竞争力。模型权重、微调代码和推理工具以 Apache 2.0 开源。
2B 参数语音模型开源,支持 30 种语言和 9 种中文方言,带可控语音克隆。做 AI 配音和后期声音的可以直接下权重跑,微调代码和推理工具都给了。