VoxCPM
VoxCPM 是一款新颖的无标记化文本转语音 (TTS) 系统,它重新定义了语音合成的真实感。通过在连续空间中对语音进行建模,它克服了离散标记化的局限性,并实现了两项旗舰功能:上下文感知语音生成和逼真的零样本语音克隆。与将语音转换为离散标记的主流方法不同,VoxCPM 采用端到端扩散自回归架构,可直接从文本生成连续语音表示。VoxCPM 能够理解文本,推断并生成合适的韵律,从而以卓越的表现力和自然流畅的语调呈现语音。它能够根据内容自发调整说话风格,并基于 180 万小时的海量双语语料库进行训练,生成高度契合的语音表达。
开源项目
4.8
应用截图
暂无截图
应用截图正在收集中,敬请期待