用GAN也可以P图，效果还不输PS | 英伟达出品

丰色 2021-11-12 14:30:52 来源：量子位

给自己多P点头发

把人的眼睛变大、把闭着的嘴合上、转动眼珠：

用GAN也可以P图，效果还不输PS | 英伟达出品

质量如此逼真、一点糊图的痕迹都没出现——

如果我不说，你知道这其实是GAN自己P的吗？

用GAN也可以P图，效果还不输PS | 英伟达出品

除了人脸，汽车啊鸟啊猫啊也都可以，比如改改车轮大小、换个车轴样式：

用GAN也可以P图，效果还不输PS | 英伟达出品

用GAN也可以P图，效果还不输PS | 英伟达出品

把小鸟的喙部变长、头抬高、胸脯变壮：

用GAN也可以P图，效果还不输PS | 英伟达出品

用动图展示就更炫酷了：

用GAN也可以P图，效果还不输PS | 英伟达出品

大点大点，圆点圆点，头发再多一点……

用GAN也可以P图，效果还不输PS | 英伟达出品

怎么样，这GAN的效果是不是也不输PS？

一个高质量P图GAN

以上这些都来自一个叫做EditGAN的模型，可以对图像实现很多细节上的编辑，同时还能保持原图质量。

研究出自英伟达、多伦多大学以及MIT，相关论文已被NeurIPS 2021接收。

用GAN也可以P图，效果还不输PS | 英伟达出品

在此之前，大多数基于GAN的图像编辑方法往往都需要大规模数据集上的语义分割注释才能训练，并且也只能做一些有限的修改，有的甚至只是在两张图之间简单地进行插值。

EditGAN作为一种全新方法，只需少量语义标记就能训练。

它会把原图像分割成高度精细的语义块（segmentation mask），有多精细呢？

就比如下面这张人脸图，被足足按30种语义进行了分割：

用GAN也可以P图，效果还不输PS | 英伟达出品

而在一个交互工具中（还未开放地址），只需操作这些语义块就可以对相应部分进行修改。

用GAN也可以P图，效果还不输PS | 英伟达出品

EditGAN的关键思想在于利用图像和语义分割的联合分布p(x, y) 。

具体来说就是给定要编辑的新图像x，将其嵌入到EditGAN的潜空间，由于语义分割图和RGB图像共享相同的潜码，所以可以得到相应的分割图y。

接着，使用简单的交互式数字绘画或标签工具，可以根据所需的编辑手动修改分割图y。

然后进行共享潜码的优化，以保持新分割图与真实图像的RGB外观一致，如图所示：

用GAN也可以P图，效果还不输PS | 英伟达出品

相应的梯度则通过共享生成器反向传播而成。

结果就是潜空间中的编辑向量δw + edit。

此外，EditGAN通过学习提炼各种各样的编辑向量，可以直接应用于新的图像。

用GAN也可以P图，效果还不输PS | 英伟达出品

还可以泛化到绘画作品上

真实质量如何？

研究人员在在四个不同类别的图像上对EditGAN进行评估：汽车（空间分辨率384×512）、鸟类（512×512）、猫（256×256）和人脸（1024×1024）。

定性实验结果

将EditGAN此前学习的编辑向量应用于新图像，经过30个优化步骤的细化，EditGAN的编辑操作保持了原图像的质量。

用GAN也可以P图，效果还不输PS | 英伟达出品

用GAN也可以P图，效果还不输PS | 英伟达出品

用它进行高精度细节编辑的效果也很好，比如下面左图对轮轴的旋转，右图对瞳孔大小的修改：

用GAN也可以P图，效果还不输PS | 英伟达出品

在下面这种高清的图像上效果就更好了：

用GAN也可以P图，效果还不输PS | 英伟达出品

作者表示，目前其他方法都还不能达到这样的效果。

此外，EditGAN也有很强的泛化能力，比如在下面这种绘画等风格的人像上，做点小表情毫无违和感。

用GAN也可以P图，效果还不输PS | 英伟达出品

定量实验结果

和基于MaskGAN的smile编辑基准的模型相比，EditGAN则实现了最佳属性精度和ID分数。

用GAN也可以P图，效果还不输PS | 英伟达出品

最后，和所有基于GAN的图像编辑方法一样，EditGAN仅限于应用到由GAN建模的图像上。

作者介绍

一作凌欢，多伦多大学博士生，同时在该校人工智能研究院（Vector Institute）和英伟达做研究。

用GAN也可以P图，效果还不输PS | 英伟达出品

共同一作Karsten Kreis，英伟达高级研究科学家，2018年以博士学位毕业德国马普高分子所。

用GAN也可以P图，效果还不输PS | 英伟达出品

其余作者包括：英伟达多伦多AI Lab的Li Daiqing，多伦多大学的Seung Wook Kim，以及MIT教授Antonio Torralba。

通讯作者为一作导师，多伦多大学副教授，英伟达AI总监Sanja Fidler。

用GAN也可以P图，效果还不输PS | 英伟达出品

论文地址：
https://arxiv.org/abs/2111.03186

项目主页：
https://nv-tlabs.github.io/editGAN/

版权所有，未经授权不得以任何形式转载及使用，违者必究。

GAN 图像处理英伟达

相关阅读

GitHub热榜第一：小姐姐自拍，变成二次元萌妹，效果远胜CycleGAN

宅男的春天。

栗子2019-08-05

GAN 机器学习计算机视觉

苏妈AMD全力押注AI：MI300对标英伟达超芯，研发增长近四倍，AI早已成财报关键词

放眼五年，你会在AMD的每一款产品中看到人工智能。

白交2023-06-03

AMD 芯片苏妈英伟达

单张图像就可以训练GAN！Adobe改良图像生成方法 | 已开源

十三2020-03-30

Adobe GAN 图像处理

朱俊彦团队提出GAN压缩算法：计算量减少20倍，生成效果不变，GPU、CPU统统能加速

鱼羊2020-03-25

GAN 压缩算法朱俊彦

英伟达新核弹GPU：4nm制程800亿晶体管，20张即可承载全球互联网流量，全新Hopper架构太炸了

性能功耗双爆炸

丰色2022-03-23

GPU 英伟达

英伟达Orin一旦「有事」，国产自动驾驶芯片谁能替代？

不会毫无准备

贾浩楠2022-09-01

华为地平线自动驾驶芯片英伟达

热门文章

业界首创，海螺集团携手华为发布水泥建材人工智能大模型

无需数据标注！测试时强化学习，模型数学能力暴增 | 清华&上海AI Lab

分化浪潮中的投资新局｜第19届中国投资年会·年度峰会在京召开

智能车速度刷新：仅10个月，首个纯端侧大模型上车量产！

特斯拉Q1净利润腰斩，马斯克宣布重心回归公司