EchoMimic 是一个音频驱动的肖像动画系统,可以生成与音频输入同步的逼真的说话面部视频。该系统由蚂蚁集团终端技术部开发,采用先进的深度学习技术,生成与语音或歌声同步的逼真面部动画。
Echomimic 功能展示