让霉霉中文开口跪”的AI有开源平替了!每月立省350(doge)
郭德纲用英语说相声
丰色 发自 凹非寺
量子位|公众号QbitAI
能让霉霉中文开口跪、郭德纲用英语说相声的那个AI——
有开源平替了!
这是用它让罗翔进行英文普法的效果,张三李四“要素齐全”:
以及英文讲人生哲理“你的内心有没有幽暗的成分”(cr: line xiongjie lin):
相比起来,虽然和原产品(也就是HeyGen)有一点差距,但是网友的评价是:
也还可以。
主要有了它,咱们在本地就能无限玩视频翻译,直接好处那可就是每月立省350~(手动狗头)
毕竟,HeyGen再厉害,也只有2分钟免费时长。
具体瞧瞧。
HeyGen开源平替来了
这个视频翻译平替名叫MyHeyGen,来自b站UP主:@ai浮世绘。
他的首页里还有很多效果展示,比如这个新鲜出炉的“这英”。
除了英文,MyHeyGen还支持转法语、日语等共计16种语言。
视频翻译的三个流程:音频翻译、翻译校正和视频唇纹合成,它全部一个流程解决。
如果你想亲手试试,步骤也不复杂。
大概流程是先环境准备:
需要分别去Huggface申请个token、去百度翻译申请个AppKey,并下载权重和checkpoints文件。
然后就可以git clone安装了。
开始测试之前,记得将你要翻译的视频下载保存到本地。
然后在执行命令中提供其保存路径+想要翻译成的语言代码(比如’en’代表英语)+翻译好的视频保存路径就可以坐等了。
命令的完整格式如下:
python translate.py 原视频文件路径 目标语言代码 -o 保存路径
有网友实测成功:
不过,还是必须得满足16G显存才ok,以及windows用户可能需要自己再解决一下兼容问题(up主该视频底下有人提供了方法)。
如果这些都不行,可以再等等colab实现,up主表示在测试中了。
效果方面,可以发现MyHeyGen音色复刻得很是到位,用了最新的语音克隆开源技术XTTS v2。
投喂给AI一个明星的采访视频,它就能克隆其中的声音讲不同的话。
这是推特博主@Gorden Sun用霉霉的声音测试的一个效果:
,时长00:10
至于MyHeyGen的缺点,大家看完表示也明显。
比如有人反映口形有一些不同步,有人则吐槽遇上面部大幅活动就容易“抽风”(如本段开头的“这英”)等等。
但整体玩一玩还是ok的。
One More Thing
仔细一翻,HeyGen的开源替代品还真不少。
有俄罗斯程序员也在业余时间做了一个:HeyGenClone。
用的是谷歌翻译,可以支持上百种目标语言,但只支持原语言为英文的视频。
由于只给了一个很短的俄语效果展示,不是很好评鉴,这里就不放视频了~
参考链接:
[1]https://twitter.com/dotey/status/1722543725459452211
[2]https://twitter.com/gorden_sun/status/1722439866112463163
- 多个中国团队斩获EMNLP’24最佳论文!UCLA华人学者中三篇杰出论文,明年顶会落户苏州2024-11-15
- 把Runway、Luma们一锅端了!这款视频模型上“杀手级”功能:一致性魔咒终于打破2024-11-14
- 灵宝CASBOT首款人形机器人发布,会做家务,续航超过4小时2024-11-14
- 彩云小梦V3.5上线!首个基于DCFormer架构通用大模型发布2024-11-13