当专业动画师用GAN帮自己“偷懒”,几分钟就完成了几周的工作
性转、年龄变化都ok
萧箫 发自 凹非寺
量子位 报道 | 公众号 QbitAI
当视觉特效师与GAN强强联手,做出来的动画会不会更好看?
答案是YES。
这是一位视觉特效师,用海外版抖音上超火的小姐姐Bella Poarch的视频,生成的奥巴马TikTok版动画:
不仅动画效果逼真,表情生动,GAN生成的人物也不会出现意外“脱模”的情况。
当时,这位专业动画师一接触到AI,就看中了AI搞艺术的“本事”——用GAN将一个视频中的人物动画化,只需要几分钟。
相比之下,如果用正常的软件进行动画制作,可能需要耗费一个动画师几周的时间。
不过,他很快发现,现有的这些AI人脸动画化的模型,做出来的卡通形象实在太丑。
如下图,此前用AI将安倍晋三动画化后,卡通人物的脸色看起来不太好……
△动画化后有点印堂发黑的诡异感
于是,他干脆自己上手,结合现有的GAN模型进行优化调整。
效果好极了!
不仅像是给正常的人脸加了美颜特效,卡通形象简直堪比迪士尼动画中的主角:
连奥巴马都“返老还童”,比开了美颜看起来还年轻。
而且,任何人都能控制这些卡通人物的表情,即使是提前录制好的视频也可以。
那么,这样的动画效果,到底是怎么做出来的?
迁移学习的妙用
这位视觉特效师,选择了用一种特殊的方式制作好看的卡通人物形象。
他利用迁移学习生成了一个7×6的表格,根据迁移学习的强度来生成不同风格的人脸。
也就是说,如果迁移学习强度越大,人物就会越接近卡通化,而迁移学习强度越小,人物就越接近真实形象。
可以看见,图像越靠近左下角,人像就越真实;而越靠近右上角,人物就更接近卡通化。
这样,既能最大程度上保留人物的特点,又能使卡通脸看起来更逼真。
而且AI还能根据“客户需求”,判断出更适合的人像,并进行数据训练。
连尤金老爷子看起来都年轻了不少,甚至有点《飞屋环游记》里老爷爷的慈祥意味了。
在这其中,视觉特效师利用了GAN来生成卡通人物的形象。
既能“性别转换”,也能变化年龄
这位视觉特效师采用的基础模型是Justin Pinkney和Doron Adler的作品StyleGAN2 FFHQ (Nvidia的模型),主要根据DeepAI做成。
StyleGAN的原理在于,它摒弃了输入层,添加了一个非线性映射网络。
此外,它创新了一种名为style-based generator的生成器,能够控制所生成图像的高层级属性(high-level attributes),如 发型、雀斑等。
而且,这个StyleGAN自带一个开源数据集FFHQ,里面包含着各种各样的人脸数据集。
而这位视觉特效师,则是将这个StyleGAN2 FFHQ进行了微调。
利用GAN生成的人物形象,不仅可以卡通化,还可以让图像模式化(Stylized),生成风格相似的人物表情和特征。
不仅可爱的小朋友能被卡通化,而且还能根据眉毛和脸部特征构建一个女孩子的面部:
如果人物“长大”了,那么模式化出来的女孩子的面部,也会变得更成熟:
这份软件目前还没开源,因为看起来,这位视觉特效师对自己做出来的动画还不是太满意,认为仍然有更多可以改进的空间。
不过,网友似乎已经有点急不可耐。
有热爱二次元的网友表示,希望这样的工具能将所有的漫画改成动漫。
也有网友表示,这样的工具看起来已经很棒了,不知道作者是否有意愿在对作品满意后,进行开源。
期待这位视觉特效师能够达成目标,将这份模型代码开源。
作者介绍
Nathan Shipley,视觉特效师,动态图形艺术家,创意技术人员,目前感兴趣的研究方向是AI生成艺术。
此外,这位特效师还曾经在2019年,为佛罗里达州圣彼得堡的达利博物馆“复活”了超现实主义画家Salvador Dali本人。
那些对画家Dali的著作有兴趣的观展者,只要按下按钮,就能看见屏幕中的Dali正对你“打招呼”,神态非常惟妙惟肖。
如果对他的艺术作品感兴趣的话,可以戳下方地址主页查看。
Nathan Shipley主页地址:
http://www.nathanshipley.com/gan
参考链接:
https://www.reddit.com/r/MachineLearning/comments/j0btow/p_toonifying_a_photo_using_stylegan_model/
https://www.dezeen.com/2019/05/24/salvador-dali-deepfake-dali-musuem-florida/
- 首个GPT-4驱动的人形机器人!无需编程+零样本学习,还可根据口头反馈调整行为2023-12-13
- IDC霍锦洁:AI PC将颠覆性变革PC产业2023-12-08
- AI视觉字谜爆火!梦露转180°秒变爱因斯坦,英伟达高级AI科学家:近期最酷的扩散模型2023-12-03
- 苹果大模型最大动作:开源M芯专用ML框架,能跑70亿大模型2023-12-07