谷歌上线AI新玩法：随手乱涂鸦，一键变怪兽

雷刚 2020-12-06 15:40:24 来源：量子位

这是Google研究人员制作的AI工具奇美拉画家（Chimera Painter）。

蕾师师发自凹非寺
量子位报道 | 公众号 QbitAI

小明随意地涂鸦了一个头部，再简单地画了个翅膀，加上一个大尾巴……再单击「转换」键。

一只面目狰狞、皮肤粗糙、纹理细致的大怪兽就创造出来了。

这是Google研究人员制作的AI工具奇美拉画家（Chimera Painter）。

这是个线上绘画工具，可以将涂鸦变成一个栩栩如生的怪物。

奇美拉的条件型GAN

研究人员建立了一个生物混合体的概念，就像是一个纸牌游戏。

比如你拿到一张「鲸」卡，通过组合，可以变成一个「鲸VS大象」的嵌合体怪兽。

这个组合而成艺术作品，还能保留原始图像的视觉特征。

在此之前生成式对抗网络（GAN, Generative Adversarial Networks ）被广泛用于图像创作上。GAN一般包含两个模块：

生成模型（Generative Model）
判别模型（Discriminative Model）

两个模块互相博弈学习产生相当好的输出。一个优秀的GAN应用需要有良好的训练方法，否则可能由于神经网络模型的自由性而导致输出不理想。

例如，麻省理工学院和IBM合作，开发出了“GAN绘画工作室”。

允许用户上传自选图像以从多种角度修改其外观，从更改对象的大小到添加全新的物体，例如如树木、窗户、建筑物、桌子……等等。

再有，英伟达（Nvidia）最新的AI软件将粗糙的涂鸦变成真实的风景。

而在奇美拉画家中，与前两者注重照片写实的GAN不一样，他们采用了一种称作条件型GAN的方法。

这种方法与一般的GAN不一样，一般的GAN是在一系列图片基础上，生成器和判别器相互对抗磨合，形成全新的图。

奇美拉画家则是需要在生成器中输入一张创作图，在此基础上，再通过GAN生成新图。

将怪兽肢解建模，再组合渲染

为了训练GAN，研究人员创建了10000多个全彩色图像的数据集，包含不同生物的3D模型。

在这个生物模型的数据库中，不仅描绘了每个生物整体的大小和形状，还提供了肢体、器官、躯干的分割图。

艺术家就在这些“肢解”模型的基础上，重新组合出新的“生物”。可以选择头、牙齿、躯干、翅膀等不同部分进行绘画。

可以看到左侧有各种肢体部分选项按钮。

然后经过GAN，选出组合得最好的模型，将之合并，输出到Chimera Painter中。

得先制作生物纹理

在GAN模型中，在渲染对比度低的图像部分时，会有跳格，使图像失去空间连贯性。

例如这张图的腿和眼睛的识别界限不清晰，导致输出来的图像奇奇怪怪。

为了解决这个问题，奇美拉画家的研究人员开发了一种新的半自动化方法。

奇美拉画家对每种所需的生物类型（例如鬣狗或狮子）都会建立一个模型。

然后，艺术家使用虚幻引擎制作了叠加在3D模型上的彩色纹理。

再将「分割图」的单色（例如头，耳，颈等部分）套用到模型上，确保GAN了解到艺术家指定的的结构，形状，纹理和比例。

再次使用虚幻引擎将3D生物模型放置在简单的3D场景中。

为了增加数据库的模型数量，一个自动化脚本会主动采用这个3D场景。在10000张生物模型的基础上，继续补充，生成了10000+张图像+分割图。

根据生物的不同姿势，在视点和缩放级别之间进行插值，创建出全色图像和分割图，形成GAN新的训练数据集。

而每次手动创建这些数据，需要20多分钟。

谷歌表示，奇美拉画家为艺术家节省了数百万小时的时间。

AI 绘画谷歌

雷刚

谷歌上线AI新玩法：随手乱涂鸦，一键变怪兽

奇美拉的条件型GAN

将怪兽肢解建模，再组合渲染

得先制作生物纹理

相关阅读

注入Attention，精度涨30%！谷歌发表最新多目标“动态抠图”模型

"感知不强"又"徒增功耗"?为何今年5G手机也这么重视AI

周杰伦把新歌做成数字藏品/ 战损版CyberTruck现身街头/ 法国用AI揪出2万个未纳税的泳池...今日更多新鲜事在此

谷歌Gemini刚发就惹质疑：测试标准有失偏颇，效果视频疑似剪辑

欧盟针对美国科技巨头列「清单」打压：苹果谷歌在列，防垄断还要求共享数据

谷歌P图神器来了！不用学不用教，输入一句话，分分钟给结果

热门文章

英伟达含量为零！华为密集模型性能比肩DeepSeek-R1，纯昇腾集群训练

联想百应智能体入选量子位“2025年值得关注的AIGC产品”：国内首个AI服务智能体打破中小企业AI落地困局

最强视觉生成模型获马斯克连夜关注，吉卜力风格转绘不再需要GPT了

GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比

DeepSeek引爆「万物皆可AI」时代，20余位大咖分析行业痛点，万字梳理干货在此