头像秒变像素风，宅男大叔自学AI打造大师级水准，火爆推特

贾浩楠 2020-08-17 13:17:45 来源：量子位

这份为梦想而不懈努力的奋斗精神，才是真正值得我们学习的。

梅宁航发自凹非寺
量子位报道 | 公众号 QbitAI

最近，一位日本宅男大叔佐藤做了一个AI生成肖像画的网站AI Gahaku，10天内用户访问量从0暴增到100万，引爆推特。

简单易操作，上传一张人脸照片，就能生成一张大师级肖像画。

而比技术更神奇的是佐藤自己，因为他是自学AI做出来的，不得不佩服的宅男创造力。

佐藤患有阿斯伯格症——也被俗称成“社交恐惧症”，名副其实的天才病，一般来说，此类患者会在某个领域具有特殊潜能，但不适应普通人的生活。

当然，佐藤的技能点就点在了AI上。

pix2pix，TensorFlow内置的cGAN模型

让大叔此次闻名的AI技术，就是是大名鼎鼎的GAN的变种。

此次的人脸肖像画生成技术，就是大叔在TensorFlow内置的cGAN(条件生成对抗网络）中的pix2pix模型上改造而来。

不同于GAN的技术通用性，cGAN更强调特定场景下的发挥，比如AI Gahaku，就只能针对人脸，如果用户上传的是猫脸，则是无法生成结果的。

GAN的特点在于损失函数的自行计算和自动更新，这使得GAN本身具有和迁移学习结合的潜质，在近年来的发展路径上看，更多是把GAN当做手段，去实现迁移学习提出的目标，迁移学习为应用GAN提供具体指向。

TensorFlow的内置pix2pix的是基于cGAN的图像对图像翻译的模型，模型本身已经成熟，直接调用便可运用到对黑白图像着色、图像风格变化等场景的使用上来。

具体到大叔的使用上，利用pix2pix模型，大叔其实是将模型限定在大师肖像画的生成上，这也体现了模型本身强大的扩展性。

如何使用，都取决于你自身。

在佐藤的另一款作品PixelMe中，同样使用pix2pix技术，但是生成的是8bit的像素风格头像，一个模型，多种用途。

当然，实际效果因人而异，毕竟严格来说，大叔是在对既有模型进行二次开发，原有的算法和数据结构并未改变，因此性能和效果受到原有模型的限制。

宅男的AI进阶之路

大叔人生经历可以说复杂，从大学退学后，先后干过面包师，参加过护士学校培训课程，但觉得都都不太适合自己，直到他决定运用自己的才智，投身到AI的事业当中去。

那说干就干，就从TensorFlow学起吧。

借助Google Colab的算力资源，大叔从头按着TensorFlow教程学起，不过大叔也确实适合干AI，而不是去蒸糕点。

在学习过程中，佐藤找到了适合自己的方向，迁移学习和GAN，可以较好的实现图像的再生成，使用不同的图像训练数据集，可以针对具体场景进行学习和生成。

GAN属于典型的非监督学习方法，核心原理是让两个神经网络进行“对抗”，通过不断优化参数来得到最优结果，自我博弈。

这种技术主要用在计算机视觉领域，这也是佐藤选择GAN的主要原因。

得益于Google的慷慨，大叔使用的网站服务器和算力资源都较为便宜，大约为一天20美刀，大叔表示，在可接受的能力范围之内，短期不会寻求商业化。

AI for Everyone!

在红了之后，大叔也没飘。

他认为这是在做自己感兴趣的东西，而不是为了经济利益。

出于对技术的热爱，佐藤开始了自己的AI之路，并在两年之后便能上线应用。

这份为梦想而不懈努力的奋斗精神，才是真正值得我们学习的。

毕竟，不是每个人有勇气去自学AI。

参考链接：
https://cloud.google.com/blog/products/ai-machine-learning/using-google-cloud-platform-free-tier-to-scale-out-an-ai-servicehttps://www.tensorflow.org/tutorials/generative/pix2pix
https://ai-art.tokyo/en/#/https://pixel-me.tokyo/en/

GAN

贾浩楠

头像秒变像素风，宅男大叔自学AI打造大师级水准，火爆推特

梅宁航发自凹非寺
量子位报道 | 公众号 QbitAI

pix2pix，TensorFlow内置的cGAN模型

宅男的AI进阶之路

AI for Everyone!

相关阅读

“众所周知，视频不能P”，GAN：是吗？

高中生都在研究神经网络，我这个老师力不从心了

GAN不只会造假：捕获数据中额外显著特征，提高表征学习可解释性，效果超越InfoGAN | IJCAI 2020

Bye Bye TPU，4个GPU训练“史上最强”GAN！作者开源PyTorch模型

现在最好玩的AI竟然来自一个家谱公司？？？

MIT披萨GAN登上了CVPR：加香肠、去橄榄、再烤熟，分层才是王道

热门文章

数学家们仍在追赶天才拉马努金

7×24小时非人类科学家入场：当AI开始自主探索科学未知领域 | 多伦多大学

全栈AI基础设施支撑，跑出全球首个开放使用视频生成DiT模型

蔚来李斌：一年减少了数十亿英伟达芯片采购

不到2年，AI PPT赛道第一！像素绽放CEO赵充：今年是AI应用创业最佳时期 | 中国AIGC产业峰会

头像秒变像素风，宅男大叔自学AI打造大师级水准，火爆推特

梅宁航 发自 凹非寺 量子位 报道 | 公众号 QbitAI

pix2pix，TensorFlow内置的cGAN模型

宅男的AI进阶之路

AI for Everyone!

相关阅读

“众所周知，视频不能P”，GAN：是吗？

高中生都在研究神经网络，我这个老师力不从心了

GAN不只会造假：捕获数据中额外显著特征，提高表征学习可解释性，效果超越InfoGAN | IJCAI 2020

Bye Bye TPU，4个GPU训练“史上最强”GAN！作者开源PyTorch模型

现在最好玩的AI竟然来自一个家谱公司？？？

MIT披萨GAN登上了CVPR：加香肠、去橄榄、再烤熟，分层才是王道

热门文章

数学家们仍在追赶天才拉马努金

7×24小时非人类科学家入场：当AI开始自主探索科学未知领域 | 多伦多大学

全栈AI基础设施支撑，跑出全球首个开放使用视频生成DiT模型

蔚来李斌：一年减少了数十亿英伟达芯片采购

不到2年，AI PPT赛道第一！像素绽放CEO赵充：今年是AI应用创业最佳时期 | 中国AIGC产业峰会

梅宁航发自凹非寺
量子位报道 | 公众号 QbitAI