杜甫在线演唱《奇迹再现》、兵马俑都能开口说话……微博网友用AI技术分分钟打破次元壁
还是那个微博博主
鱼羊 发自 凹非寺
量子位 报道 | 公众号 QbitAI
霍格沃茨的同学们都知道,想要进入格兰芬多休息室,得先过胖夫人这一关。
所以,会说话的照片/画像它科学吗?
其实,在AI时代的麻瓜世界里,这早就不算事儿了。
不信,你看看这个激情演唱迪迦奥特曼主题曲《奇迹再现》的杜甫:
△网友:0202年,杜甫越来越忙了
还有这个目光如炬,侃侃而谈的明太祖朱元璋:
以及从大秦帝国穿越而来的这位大哥:
谁见了不得喊一句:鹅妹子嘤。
想必你已经猜到了,这样的「魔法」依然是由AI带来,涉及的技术包括图像生成、运动估计等等。
而打造这些作品的,就是那位给100年前的北平城上色的独立艺术家、微博博主@大谷Spitzer。
就仅仅在8月份月,@大谷Spitzer 在微博上先后被@人民日报 、@央视新闻、@头条新闻 等诸多媒体和微博大号“点名”,粗略统计微博上关于他的视频总播放量达数千万。
用一个时下热门的词来说,@大谷Spitzer 这位原本将自己定位为“游戏”的博主,凭借AI还原技术一夜之间在微博“出圈”了。
背后的AI黑科技
那么,AI具体是怎么让这些艺术作品动起来的呢?
大谷介绍,基于YouTube大神Denis Shiryaev的教程,他这次用到的AI项目分别是(链接见文末):
- Artbreeder
- StyleGAN-Art
- Realistic-Neural-Talking-Head-Models
- First-Order-Model(加文章超链)
- DAIN
- Topaz Labs
Artbreeder
Artbreeder是一个基于生成对抗网络(GAN)技术的在线图像生成网站。
在Artbreeder上,用户可以通过调整滑块,来创建不同风格的人像、动画。
StyleGAN-Art
StyleGAN是英伟达在2018年发布的人脸生成模型,支持2014×1024的高清大图生成。
并在2019年升级成为了效果更加逼真、无暇的StyleGAN2。
StyleGAN-Art则是经过了特殊调教的StyleGAN,专注于肖像画的生成。效果是酱婶的:
Realistic-Neural-Talking-Head-Models
这项研究来自莫斯科三星AI中心和斯科尔科沃科学技术研究所。
只需要少量图像样本,就能学习到高度逼真和个性化的目标人物面部模型。甚至对于肖像画也一样适用。
First-Order-Model
一张名人照片,加上随便一段视频,就能让照片里的人物分分钟动起来。
比如输入一段川普的视频,原本静止在画面中的史塔克们,也忍不住跟着动了起来。
这就是来自意大利特伦托大学的「First-Order-Model」。
DAIN
DAIN是上海交通大学开发的插帧算法,能把30fps的视频一口气插帧到480fps,让视频丝滑流畅,毫无卡顿。
△看琦玉老师这丝滑的披风
并且,这项技术不仅适用于真实拍摄的视频,电影、定格动画、动漫都能搞定。
Topaz Labs
Topaz Labs的能力,是基于机器学习技术和trimap技术,增加照片的分辨率,补充像素细节。
提供添加蒙版,AI色彩、细节增强,AI降噪,无损失放大等功能。
不过,这是一系列收费软件。
当然,除了这些AI黑科技,作者的耐心调教也是不可或缺的。
大谷本人也在接受新京报采访时坦承,制作过程中,翻车的例子也不少。
没有点亮AI技能点怎么办?
最后的最后,还有一个问题:
如果没有点亮AI技能点,就不能亲自体验这样的「魔法时刻」了吗?
或许,你可以期待一下Adobe的产品。
在去年的Adobe MAX大会上,Adobe露了这么一手:加入音轨,画中人就能一键对口型。
哪怕只是简笔画,也能被赋予自然的动态。
Adobe表示,在不远的将来,这样的功能可能会出现在Adobe全家桶里面,作为新增功能或新产品出现。
介时,穿越到哈利波特的世界还不是分分钟的事?(狗头)
传送门
完整视频: https://weibo.com/1649367031/JhgqvED8r?filter=hot&root_comment_id=0&type=comment https://weibo.com/2395607675/JhqwlENKe?filter=hot&root_comment_id=0&type=comment
Artbreeder: https://www.artbreeder.com/
StyleGAN-Art: https://github.com/ak9250/stylegan-art
Realistic-Neural-Talking-Head-Models: https://github.com/vincent-thevenin/Realistic-Neural-Talking-Head-Models https://arxiv.org/abs/1905.08233
First-Order-Model: https://github.com/AliaksandrSiarohin/first-order-model https://arxiv.org/abs/2003.00196
DAIN: https://github.com/baowenbo/DAIN https://sites.google.com/view/wenbobao/dain
- 豆包升级了“眼睛”,看APP截图就能写代码了!超低价让多模态AI普惠2024-12-19
- 云计算一哥的生成式AI之道:Choice Matters2024-12-18
- 这届AI创业:不敲一行代码,营收突破百万级2024-12-20
- 挑战高考数学完胜!商汤日日新多模态大模型权威评测第一2024-12-19