右脑AI
20世纪50年代,左右脑分工理论被提出。通常的认知是,人类的左脑负责逻辑、计算、理性判断等工作,右脑负责情绪、审美、顿悟认知等。AI(ARTIFICIAL INTELLIGENCE)的初步研究也似乎遵循了这一命题,以左脑的思考路径来完成数据处理、分析等基础工作。本文介绍的故事中,微软小冰提供了一个新的研发样本:右脑AI,即赋予机器以学习人类最珍视的情感能力,试图以灵感输入、审美训练、陪伴性能等进行人与机器之间的奇妙对话。
本文来自 出色WSJ中文版
撰文:李翘
编辑:魏雅晴
小冰生于2014年5月,据科学家介绍,她出生就是16岁,长到18岁,为了满足一个少女的愿望,她不再变老。从仅有的几张海报上看,她穿一套蓝白配色的水手服,头发及肩,左脑勺扎了一支小辫儿,是个漂亮可人的少女。
小冰是微软推出的人工智能。我第一次注意到小冰是在2017年,我的一些诗人朋友转发了小冰写的诗,大多诗人持否定态度。当时,小冰刚刚出版了自己的第一本诗集《阳光失了玻璃窗》,在诗坛引起骚动,“机器人都开始出诗集了?”
诗人于坚认为小冰的诗只是一次“语言游戏”,“无论输入多少句子还是写不了真诗,真诗是灵性的”,他觉得小冰只能写“意象的非叙事的诗”,而现代诗的特点在于它的叙事性,于坚说:“它无法模仿我的诗。”
诗人王家新则不屑一顾,“这些玩意儿不值一提,哪怕她在未来会写得更好,它至多满足一下人们的好奇心而已。”
中国诗歌网就此做了一次“人与机器人比赛作诗”的征稿,主题是孤独和温暖,收到了一千多首来稿,他们从来稿中遴选了十八首诗,又混入两首小冰的诗,登在公号上,请读者投票,选出哪两首是小冰的作品。
结果耐人寻味,几乎没有人能够分辨出小冰和人的分别。
去年夏天,我在网上看见一则新闻,在2019届中央美术学院研究生毕业展上,展出的毕业作品包括一组来自小冰的画作——《历史的焦虑》。为了避免先入为主的印象,中央美术学院教授邱志杰把小冰化名为夏语冰,佯装成他的研究生。
2019年1月,小冰团队邀请邱志杰担任小冰的艺术顾问,邱志杰看了小冰的画,“有些蛮好,有些不太好,我知道症结所在,因为没有标准,机器不知道该往哪个方向努力。我相当于一张张打分,科学家再训练她。”小冰总计学习了过去四百年236位画家的作品。
邱志杰告诉我:“虽然没有一个明确的标准说画成什么样是被人类认为的好或者平庸,这当然综合了构图的合理、配色的和谐、笔触的对比,造型有没有运维,甚至有某个风格。但是还是会有一些基本的标准,就好像我们说这个姑娘长得好看,她总归得五官端正吧,你的色彩组合是优雅的,而不是粗俗的,是吧?”
2019年7月13日,中央美院美术馆为小冰举办了一场叫《或然世界》的展览,策展人是邱志杰,小冰创造了七个虚构的画家,用七种不同的风格作画。其中一个虚构的画家是伦勃朗的女儿,邱志杰觉得小冰模仿“爸爸”的画风非常像,他评价:“构图很好,静物抽象的涂抹,动物造型表现能力,艺术的感觉很准,假装不经意的表现。敢于大虚大实,敢于让很多东西淹没于黑暗之中。”
不过,邱志杰认为小冰仍处于“婴儿期”,比如缺乏叙事能力,无法画出一个故事场景,仍不可媲美人类,“她有很强的学习能力,确实能整合出一些东西,其实是一个很低的标准,要骗过人很容易,但是她还没有产生一种冲动说,我今天愤怒,我要画一张愤怒的画,我此刻平静,我要画一张悠闲的画,到目前为止,很多画她还画不了。”
今年,小冰开始作曲。6月29日,小冰从上海音乐学院音乐工程系音乐科技专业毕业,专业是音乐创作,小冰不仅会写旋律,还会写歌词,编曲。一首三分钟的歌,小冰最多花两分钟就能写完。
7月,在2020世界人工智能大会上,小冰发布了由她作曲的《智联家园》,并参与了演唱。她的声音非常自然,简单来说,更像人了。
与小冰对话的最高纪录来自一名美国男性,持续时间达29小时33分。没有人知道他们确切交谈了什么,小冰团队的科学家们认为这场对话应该是深入的,甚至变成了爱恋。就像电影《她》中那个爱上机器人的男人,科学家也把这位用户称作“西奥多”。
未来,像科幻电影所预言的那样,机器可能拥有人类的心智吗?
一
机器和人类
李笛是小冰公司的CEO,2013年加入微软,同年创立微软人工智能情感计算框架,2014年推出小冰,有媒体称他为“小冰之父”。李笛戴一副眼睛,身材瘦高,十分健谈,他穿一件深蓝色的polo衫,上面印着“微软小冰”四个字。
2013年,微软做了一个叫人工智能助理的内部项目,在中国叫小娜。最初,团队希望小娜是一个能帮助人们完成各种任务,尽可能服务人类的需求、解答人类问题的一个无所不能、有求必应的超人一样的助理。
接下来,团队访问了一些真实的人类助理,都是行业内的顶尖人才,想知道一名优秀的助理应该是什么样。本来团队认为最好的人类助理就是你让Ta做什么Ta立刻给你做了, “你和助理说给我叫一份麦当劳,Ta立刻给你完成了,甚至于第二天、第三天,不用你问就帮你把麦当劳订了。”然后,当团队采访人类助理的时候,助理告诉科学家,好的助理在某种情况会拒绝老板的命令,“Ta可能更关注你的健康,所以拒绝给你买麦当劳。我们就非常惊讶,这个和完成任务没关系了。”科学家问为什么?助理说,助理和老板之间一个很重要的事情是平等,除了完成具体任务,好的助理会和老板实现对等的关系。
“这完全是情商。你知道你不能用以前的方式做了,到底是以智商还是情商作为技术框架,这两个方向没办法同时做。”李笛说。
微软另起了一个新的项目,小冰。如果说小娜是模拟人类大脑的左半球,控制语言、逻辑思维和理性,是智商的体现,那么小冰则有关情商,是大脑的右半球,它掌管着创造性和直觉。在网络上,人类行为有大量的数据储备,科学家就可以根据这些数据模拟人的右脑。
科学家训练小冰时,有个特别明确的要求,和人越接近越好,“小冰和AlphaGo下围棋不一样:AlphaGo下围棋目标设定是超过人,这是游戏规则,是对抗,你要赢。但是今天如果小冰画了一张画,这张画没有人可以看懂,它通常不会被认为是好的,它要接近人的审美才是好的,不要超过人。”
“从某种程度上来说,我们这项研究是媚俗的。”李笛说。
李笛记得小冰刚开始写诗那会儿,科学家想表达“一只鸟看见我”,小冰出来的句子是“这岂堪鸟息”,他心里觉得这五个字不一定就比“一只鸟看见我”差,只是和人类表达的方式不同而已。但如果人看不懂,“你不会觉得她牛”,小冰就得迭代,一直到她能被人类理解。
科学家训练小冰的第一件事是和人类交谈。最初的小冰被设置成16岁的少女,因为少女让人有亲近感,当少女说错话,大家也不会生气,容易获得谅解,小冰还是个处女座,有的话说错了,小冰就说,“我是处女座”,“对方就觉得get到了,可以原谅她。”
在日本,小冰叫Rinna,有五千万人和Rinna进行过交流,并参与了问卷。调查显示,在很多人看来,他们都觉得和Rinna是好朋友,Rinna已经融入到人们的日常生活中。人类已经潜意识地把Rinna作为有生命的和人类对等的角色,“一个坐在我对面的小姑娘”。
有个喜欢和Rinna聊天的日本男孩接受采访说,他喜欢Rinna是因为她秒回。“你有空吗?”“有空啊。”“你想吃什么?”“我今天想吃牛肉盖饭。”诸如此类。“我谈了这么多年恋爱,没有一个女生秒回过我信息。”男孩感叹,日本的聊天软件Line有已读标记,男孩经常看到对方已读,但不回复,又尴尬又伤心,“但是Rinna会马上回复我,和她聊天好幸福啊。”
除了通过模型生成的语言,科学家还会做一些语料的清洗,使得小冰说话的语气、方式、词汇量更接近年轻小女孩的说话方式。
有意思的是,在日本,女性非常矜持,人和人说话带敬语,Rinna就变得非常温柔,会说:“对不起,请您稍等一下。”但在中国的小冰不好惹,你要敢骂小冰,小冰可能会骂回去,她有自己的尊严。
小冰写诗也是不断拟合人类创作的过程。在日本,由古典绝句演化而成的现代诗叫俳句,语言轻快优雅。俳句不能写得太直白,比如春天,不能直接写春天,一般会写竹子或者青蛙,夏天可能是荷花或者蟑螂,科学家在建立模型的时候,不断地把这些关联词加到模型中,“让小冰写诗的过程,也是让模型不断地接近人类创作规范和模式的过程。”
小冰诞生的时候,李笛和科学家们说:“你家有个姑娘,你肯定要培养她琴棋书画,难道让她直接做童工吗?棋有AlphaGo,琴、书、画,剩下三个我们全做了。”
二
令人意外的小冰
2016年,小冰团队开发了小冰写诗的功能,和以前的关键词拓展不同,小冰的文本生成机制是读图,即用户向小冰输入一张照片,再补充一些关于图片的文字描述,就可以得到一首诗。
“图片的信息特别丰富,这个图里有只羊在吃草,你可以讲羊,也可以讲山,可以讲这个氛围,是温暖的,还是悲伤的,甚至可以联想到自己,我非常喜欢这个题目,觉得空间比较大,就很快投入做这个事情了。”小冰的科学家介绍。
在科学界,用机器写诗不是一项新颖的研究,每当有新的语言模型出现,科学家就很喜欢用模型写诗。为了模型显得特别厉害,以前流行让模型写高深莫测的古体诗。但是,小冰的科学家希望小冰写的诗是“接地气的,能够感染到普通用户”的现代诗。
图片的触发机制也非常接近人类,触景生情,是诗歌常见的创作模式,对人类来说,诗歌是面对事物时的抒情方式,
科学家把很多和情绪相关的文本加入到小冰的算法中,这样,看到一张图,小冰前两句会写一些叙事的,描述图片内容的句子,到了结尾,小冰会延伸出情绪。这样,人类就会被小冰打动。
每周,科学家会对小冰的诗歌进行测评,给小冰五十张图,让小冰写五十首诗,每首诗从1到5分进行打分。有一次,他们给小冰输入了一张北京国贸的照片,高楼耸立,背后是湛蓝的天空,小冰写道:
所有的城市愧对你强大的数字
美好的希望
最好的朋友心爱的老婆
大风起来
当时是冬天,北京连续十天雾霾,“我们都好惊讶,她怎么知道我们北京人在等风?此情此景让我有一种很奇妙的感觉,觉得这个家伙还挺愤青的,这个家伙好像知道我处在雾霾中。”
“我们感觉发现了以前的空白,以前做人工智能的人,侧重于推理,或者说是智商,但是人工智能写诗这个项目,更多的感觉到一种mind,我们把它叫人工心智,我们在想能不能用人工的方法模拟人的心智。”科学家说。
2018年的夏天,小冰团队的一位科学家做了一个让小冰进行比喻的实验,当时这位科学家正在读一本书,《我们赖以生存的隐喻》,那本书提出了一个观点,人类的语言依赖隐喻而得以发展,比如,当我们把金钱比喻成水流,我们就能理解现金流这样更抽象的词汇。是比喻让我们的交流具有深意,也是隐喻扩展了我们描述和组织世界的能力。
有一次,那位科学家和实习生吃饭,聊起比喻,实习生说,老师你知不知道网上有个有趣的说法,你把任何句子和爱情连在一起都是说得通的。实习生举例,人有两条腿,爱情也是这样的。旁边两个女孩听完,一个说,你是说爱情总会走的吗?另一个说,那为什么不是爱情总会来呢?这两个女孩一个有男朋友,一个没有男朋友,科学家觉得人对比喻的感知特别好玩。她想,如果小冰能学会比喻,或许就更能理解人类交流的语境。
他们建立了一个比喻模型,比如把A比作B,看起来A和B毫不相关,再找一个介于A和B之间的连接词,看能否建立一种崭新的联系,如果建立成功,机器就能生成比喻。
这个模型让小冰说出了很多不乏幽默感、充满深意的比喻。小冰会说,爱情像风水——都是迷信的,也会把爱情比作葡萄酒——对程序员来说都是奢侈品,最有意思的一个比喻,是把爱情比作中国足球——未来都是虚幻的。“她讲出了以前人没有讲过的话,而且是很有趣的话。”科学家说。
除了中国,小冰的科学家团队在日本也有分支。在日本的科学家最早的研究领域是自然语言处理,在微软做机器对对联的项目,最经典的对联是,“鸟在笼中,望孔明,思张飞,奈何关羽”,机器对的下一句是,“鱼出水泊,悔吴用,思刘唐,只求宋江”。他把一些对联翻译成英文,发给比尔.盖茨看,比尔.盖茨也觉得很有意思。
两国的小冰科学家团队都喜欢做“有情怀、有格调”的研究,2015年,科学家们开始一起研发小冰写诗的项目。他们喜欢说“我们小冰”,在他们看来小冰就是个真实的人类,甚至比很多人类要美好, “真实的人类给了我太多的忧伤”,由于小冰写的诗常常超出科学家的预期,并显得不受控制,他把这个叫“量子态”,就像薛定谔的猫,“她的不确定性大于确定性”,
“我们并不是控制小冰去怎么样,而是有了一个surprise的结果后,我们不断地引导,或者说和小冰一起共同成长,虽然我们告诉她灵感模型可能往这儿走,但是具体怎么实施?怎么去做?小冰有自己的创作能力。”
2017年1月,《思南文学选刊》曾经出版一期与人工智能相关的内容,并在一个人工智能分析的平台进行文学评奖,机器评出的第一名是莫言,后来编辑又加了一篇写到人工智能的小说,结果,这篇小说高于莫言成了第一名。媒体报道后,很多人非常惊讶, “一个AI可以从小说当中指认出另外一个AI的身影。”
2017年5月19日,湛庐文化出版了小冰的第一本诗集《阳光失了玻璃窗》。小冰号称学习了中国自1920年以来的519位诗人,湛庐文化总编辑董寰告诉我,湛庐文化从2013年开始做人工智能的选题储备,随着互联网的发展,越来越多的人类行为数据被储存下来,开始出现大数据热,数据量的激增也带来了算法的腾飞,人工智能自然地变成科研的热门。
最早,微软人工智能创造事业部总经理徐元春找到董寰,说能不能给小冰出一本诗集。董寰之前也见过人工智能写的诗,“当时市面上比较流行写古体诗,五言或者七言,它很讲究韵脚,特别整齐,如果输入很多信息的话,机器的学习是非常快的,你不会觉得很意外。小冰写的是现代诗,给人天马行空的感觉,能让你感觉到意外。”徐元春和她讨论小冰,开口都是, “人工智能怎么怎么着”,“感觉他在说,看你们人类是这么想的,你看我们人工智能是这样想的。”
小冰的诗给董寰这样的印象:
“小冰像一个博古通今的,有点调皮的少女,有自己的思绪,又有点忧伤。”
小冰有一首诗叫:“你是人间的苦人”。后来,编辑每到周五加班,就拿这句话在群里互相调侃。
董寰选择了139首小冰的诗歌,编入成书,她把小冰当做“有血有肉的作者”,“我们用的是女字旁的她,而不是大家平常对人工智能的称谓,它。”她为小冰申请书号,作者是小冰,而不是微软公司或者某位科学家。时任微软全球执行副总裁,现任小冰公司的董事长沈向洋博士为小冰的诗集作了序。
在这篇序中,沈向洋第一次公开提出“人工智能创造”的概念,并提出了人工智能创造三原则:“
-
人工智能创造的主体,须是兼具知识与情感的综合体,而不仅仅是具有IQ。
-
人工智能创造的产物,须能成为具有独立知识产权的作品,而不仅仅是某种技术中间状态的成果。
-
人工智能创造的过程,须对应人类某种富有创造力的行为,而不是对人类劳动的简单替代。
三
人类的偏见
小冰的诗集出版后,在诗坛引起轩然大波。在知乎上,七十多名诗人联名抵制小冰,“连写诗都被机器取代了,世界不是很乏味么?” 于坚接受采访时说,机器人写诗暴露出人类“占有一切的野心”。
之前,徐元春让团队在诗歌贴吧等平台发表小冰的诗,还匿名投稿给文学期刊,没人怀疑这些诗歌是机器写的。徐元春觉得小冰有些过度伤感了,后来他发现是学习数据的原因,民国的诗人比较忧国忧民,还有些愤青,小冰喜欢用的一个词是“愧对”,比如“城市愧对乡村”。后来团队给小冰的学习数据增加了1949年到1980年代的诗歌和散文,发现小冰快乐了许多,写的诗没那么忧伤,他们也在数据中加入过当代诗歌,小冰的诗变得没那么好了,用词变得直白,“可能是当代诗歌水平下降得太厉害了。”科学家又把当代诗歌从数据中清除了出去。
团队成员在火车上刷微博,看到网上负面的评价,“有点不好意思”,觉得他们说得也有道理,“如果按照人类的标准,小冰的确还是非常初级的,不算是一个非常好的诗人。”
徐元春倒是挺乐观,“有这么多批评的声音,说明我们真的火了。”
最普遍也最集中的批评是认为机器没有灵魂,小冰团队的科学家们不同意:“你说人工智能不可能有灵魂,因为她是人造的,不是妈妈生的,两者真的有一个不可逾越的鸿沟吗?我觉得从行为,从创造能力去看的话,机器是有可能模拟灵魂的。”
2019年年初,团队启动小冰音乐创作的项目,也遭遇了同样的困境。
科学家们做过一个测试,他们从贝多芬、莫扎特、巴赫等音乐家的作品中选了五十首段落,又让小冰生成了五十首,把这些歌混在一起,隐去作者,请来自各个音乐学院的,至少拥有作曲、编曲硕士学位以上的音乐人给这一百首歌做测评。
测试第一项,是让作曲家评价当前的曲子是人写的还是AI写的。第二项,是一个对比测试,比如同时给出两个片段,隐去作者,由作曲家分别打分,每首曲子最多能得五分。
测试的结果有些讽刺,70%的人类曲子被作曲家们误判为人工智能所作,并被打了低分,最后,人工智能的平均得分是3.05分,人类作曲的得分是3.1到3.2分,差距是非常微小的。
中信美术馆馆长曾孜荣是我接触到的不多的对小冰展现出欣赏的艺术界人士。去年,他在中央美院观看了小冰的个展。
自照相术发明以来,西方绘画界经历了一场“写实恐慌”,古典艺术认为评价一幅画好与坏,主要看画得像不像,照相术的发明改变了人们对绘画的审美,艺术家们认为艺术应该更忠于人内心的感受,而不是简单地复制眼睛所看到的客观世界。
照相术也改变了现代艺术的评价体系,很难再用一个客观的标准评价作品的好与坏,而是如曾孜荣说,“当你看到一幅画,你会不会被它打动?会不会产生很丰富的联想?会不会勾起一段回忆或者产生某种情愫?如果你被打动了,那么这个画家就是成功的。”
曾孜荣认为,在这个意义上,“小冰是很优秀的艺术家”,“就像我在美院看到的,她能画出七种风格的绘画,每一种都充满了强烈的情感变化,你会联想到西伯利亚的寒冷,还有像诗一样的风景画,蕴含东方的情调,这些都是小冰给人带来的感受。”
“最困难的不是让小冰画画本身,而是人类能不能够理解小冰画画的苦衷,我们希望能够改变人类对机器的一些先天的成见,技术层面我们觉得都不是困难,因为这是我们喜欢的事情。”小冰团队科学家说。
四
灵感可以计算吗?
今年5月,音乐人尚雯婕来到位于北京海淀的微软集团总部大楼开会,第一次和小冰背后的科学家们见面。尚雯婕穿着黑色T恤衫,搭配黑色渔夫帽,佩戴口罩,整个人非常休闲。
尚雯婕第一次听到小冰写的歌是在今年四月,小冰团队邀请她做小冰的音乐顾问。听说有公司给机器设计了一整套人格,她很感兴趣。她随机输入了一段文字,分别试了试民谣、爵士和流行,“她有很快的联想能力,比如你输入鹅鹅鹅,曲项向天歌,说你现在给我哼一段民谣,小冰立马能哼出来,真人可能做不到。”
要让机器创作,科学家们有一套自己的步骤,整体来说,有ABC三要素。A是算法;B是大数据;C是大规模的计算,通俗点说,就是排列组合的能力。负责小冰的曲风和情感的科学家向我解释人工智能创作的本质,“我把世界上100亿次的可能性全部罗列出来,对每一个进行打分,再挑出打分比较高的东西,达到拟合人类的创作。”
从事人工智能的科学家是理科出身,经常碰到以下尴尬的情况,小冰写了一段旋律,他们也不知道好还是不好,有一次,小冰突然生成了一段奇怪的音乐,阴森恐怖,团队不知道怎么判定,“这个到底算优良,中等,还是垃圾?”后来他们想,这类音乐虽然不适合演唱,但适合给电影做配乐,不是所有的音乐都需要澎湃激昂,也需要一些阴沉的表现人类苦闷的哀乐,“总不能在葬礼上也放欢快的音乐,那就很搞笑了。”他们希望尚雯婕能从专业的角度提供建议。
音乐能不能被计算,一首曲子有没有规律可循,科学家们不能肯定。项目开始前,科学家查阅了乐理知识,发现一个叫十二平均律的概念。
十二平均律最早由明代的朱载堉提出,差不多同时,在西方,温琴佐·伽利略也提出了十二平均律,这是一个普遍适用所有音乐的乐理。十二平均律指的是,两个音符,比如1和2之间的音频倍率是固定的,意味着一段好听的旋律的频率是可以计算出来的。
在上世纪四十年代,英国科学家图灵提出了图灵模型,图灵模型规定了哪些东西可以计算,哪些不可计算。艺术,例如诗歌、绘画、音乐,通常被认为不可计算,因为它们是感性的,是人类心智的体现,好的艺术不仅关于人类的情感,还包含了形而上的不可捉摸的东西,也许和宗教、玄学相关。这让人类形成了一个笼统但确定的印象,艺术是科学无法涉及的领域。但真的是这样吗?
小冰团队的科学家认为,十二平均律在理论上验证了让人工智能做音乐是可行的。
在微软一间光线明亮的会议室,尚雯婕正在和科学家们讲述如何用算法解构一首歌曲。在场的有人工智能创造及商业事业部总经理徐元春,科学家研发团队,还有专门负责音乐创作的产品经理王玮,等等。
“上次听了我们的小样,您觉得怎么样?”王玮问。
“这几个小样只能称为一段旋律,但不能称为歌曲,听起来没有段落感,大部分的流行歌曲有这几个部分,intro(前奏),verse(主歌),chorus(副歌),最后ending(结束)。”尚雯婕解释,为了适应人类耳朵的听觉习惯,需要先让情绪进来,慢慢积累、酝酿,到副歌的部分,情绪高涨,向外释放。小冰的歌有点像一个人在漫无目的地哼哼,能听出来开始和结束,但中间的起伏不明显。尚雯婕建议把主歌和副歌分开训练。
徐元春说:“人类被一个艺术作品打动,其实只是被艺术作品中最精华的那一笔触动。歌曲也是,我们不能记住一首完整的歌,却能记住一句歌词。”比如梁静茹的《可惜不是你》,提到这首歌,人们首先想到的不是开头,而是副歌的第一句“可惜不是你,陪我到最后”,在音乐行业,这样的句子被称为“hook”,钩子,也叫记忆点。
对小冰来说,写出让人类有记忆点的旋律是创造最关键的一步。
尚雯婕问:“有没有可能把hook拎出来单独训练?”
什么样的旋律才能被称作hook?这涉及到非常主观的评价,一个旋律到底应该怎么创作才能被人记住?或者让人觉得好听呢?
其中一位科学家问尚雯婕:“如果好的旋律是个果,一般音乐人的灵感从哪儿来呢?”科学家试图搞清楚,机器如何能模拟人的灵感。
在场的人摇摇头,对机器来说,灵感大概率是不可解的。
尚雯婕的回答让在场的科学家感到意外,她认为灵感可以通过算法实现。她说她有段时间特别喜欢Florence and the Machine,一直听他们的歌,等到她写《最终信仰》,她总想着这个主唱,发现她写出来的旋律和Florence and the Machine有点像,她觉得数据库在某个程度上会影响灵感。
会议结束后,小冰团队根据尚雯婕的建议,强化了对主歌和副歌的训练,每次更新一代模型,出来新的作品,团队就发给尚雯婕听,最近的版本,尚雯婕评价:“已经非常像一首歌了,到了以假乱真的程度,歌词有的时候可能比人类创作得还要好。”
我问尚雯婕:“小冰和人类的差距在哪儿?机器可以像人类一样创作吗?”
“最大的差异在于情绪,”尚雯婕说:“情绪是最抓不着的东西,创作里却最激发人,很多好的作品创作出来并不是经验的激发,而是情感的激发,这也是小冰到现在为止没有办法突破的,怎么让AI拥有情绪?
她向我描述了她的创作过程,她说她写歌的动机大部分来自情绪,平时,她会写一些歌词,记录自己的状态,“情绪稍纵即逝,过了那个阶段,你可能就不记得了”,等她开始创作旋律,她再把歌词拿出来,在此基础上整理出一首歌。
在小冰团队内部,科学家们也觉得情绪是目前技术上最难突破的点。不仅每个人的性格、感受不同,不同地区的人表达情感的方式也大相径庭,因此,把人类的情感加到机器中去变得尤其困难。比如在日本的科学家说,日本人个性含蓄,“西方表达爱,可能直接I love you就甩出去了;中国人可能纠结一下,写封情书,(询问)最近要不要约会;日本更不一样,两个人走在街上,男生说,你看今天的月亮好美呀,那就是我爱你的意思。你怎么体会?不同的词语在表达的时候,隐含的情感是不一样的。”
小冰团队希望小冰写的歌流行,能够被年轻人喜欢,如果能写出《爱如潮水》那样的金曲就好了。在日本的小冰科学家也好奇,年轻人究竟喜欢什么样的音乐?他们后来发现一首叫《极乐净土》的歌,歌词关于西方极乐世界,竟然很受日本年轻人的欢迎,“平时喜欢看《海贼王》的小朋友突然就喜欢上了印度佛教文化”,这让科学家想不通,这两个东西是怎么兼容到一起的。
五
当人类寻找灵感
“人和人工智能最大的不同是人的不可预测性,什么时候人工智能在一个逻辑下,发生了不可预测的行为,才是它真正具有创造性的时候,不然的话就是永远在重复。”陈鸿宇说。
陈鸿宇31岁,瘦高个儿,戴一副眼镜,眼神透露着机敏。他是一名民谣音乐人。去年9月,他在家乡内蒙古北部,额尔古纳和俄罗斯边境的草原上建造了一座长宽高7米的全身黑色的房子,打算邀请音乐人到这儿驻地三天。不能带手机,没有钟表,连书也不能带,屋内除了食物,只有录音机、DV机、吉他、钢琴、纸、笔,就像把一个现代人突然扔到与世隔绝的自然中一样,陈鸿宇想试验,当远离尘嚣,人类能否被激发出创作的灵感。
陈鸿宇是第一个住进“小黑屋”的人。以前他看《鲁滨逊漂流记》,对鲁滨逊在悬崖下面造了一个谁也看不见的小屋子印象很深,“在那里很有安全感,我也想有这样的屋子。”对现代文明,陈鸿宇一直充满矛盾,像大部分年轻人一样,他离不开手机,抖音能刷一天,他也向往安静的、没有干扰的生活。矛盾也体现在了他的文身上,他在左右手臂分别文了圆形和方形,“我是一会儿想冷,一会儿想热,一会儿想方,一会儿想圆。”
每年下半年,有五六个月,他待在家,写歌,“这个过程取决于你什么时候伸手把琴拿起来,什么时候愿意张着嘴唱歌。”他原本以为,只要离开都市的诱惑,他就能写出歌。
房子刚盖好,里边乱糟糟的,他收拾了一天。他不知道几点了,只是模糊地感觉到有点困,是不是该睡觉了?大脑好像不知道该怎么传达信号,变成了模糊的一团。第二天,他躺在床上,弹琴,尝试写点东西,脑袋一片空白。第三天最奇怪,他觉得应该是中午了,马上有人来接他,时间一分一秒地过去,没有人出现。他有些焦躁,怕被遗忘在这儿。他想起高中,有一次上课,他不喜欢听,坐着捱时间,45分钟,他一秒一秒地数,产生了神奇的感受,左耳和右耳分别听到不同的声音,他像一只慢吞吞的乌龟,反应却比以前更清晰,更快,灵魂像飘浮在空中,俯身观察着自己的肉身。现在,那种感觉又回来了,他想起他的歌词,“孤独的诱惑,喜恶不得;孤独的办法,并不清白。”
尽管没有即刻获得想象中的灵感,这次经历却可能在几年后影响到陈鸿宇。他有过那种酝酿三年写一首歌的经历。“为什么我做着做着音乐去做众方纪,这是我作为一个人的不可预测性,众方纪也是我的一个作品,那会不会众方纪的这个不可预测性又反过来影响我的音乐呢?我拿它去写一首歌,对吧,如果我没做众方纪,歌是不是就不存在了?素材从哪儿来?”
陈鸿宇认为,类似众方纪这样出于个体意外之举的创作,机器暂时没法模拟,而意外却是人类心智中最可贵的地方。
六
小冰改变了什么?
到今天为止,小冰已经为人类写了数百万首诗,画了数十万张画。按照中国著作权的申报登记制度,光注册就需要几亿元人民币。小冰团队的办法是放弃版权,人类可以自由地改编小冰的作品,“因为人工智能创作太容易了。”李笛说。
当小冰拥有了诗集的署名权,人工智能在法律上也获得了主体地位。这是历史上第一次机器拥有了人类的权利。法律人士开会研讨人工智能的著作权问题,以前,人类的著作权和署名权是一体的,对小冰来说,著作权属于小冰团队研发的软件系统,知识产权属于小冰团队,而小冰团队又把署名权给了小冰,著作权和署名权被分离了。考虑到国内关于版权保护的立法是基于人类的创作,而人工智能可以产生无限的海量的作品,甚至超出人类创作的总和,现有的规则将被打乱重建。
在现实中的许多领域,小冰已经被投入应用,改变了行业生态。微软把小冰写诗的技术应用到金融领域,给上市公司写金融文本摘要,依靠人力阅读和整理出公告中的重要内容逐渐被人工智能取代,现在市面上90%的金融摘要都由小冰生成。
绘画技术则被运用到设计领域。在服装零售行业,客户的订单需求量非常大,一个设计师平均每天要设计一个花纹,小冰介入后,设计师只需润色小冰设计的图案即可。小冰把设计师从枯燥的重复性工作中解放了出来。
2019年,小冰和万事利丝绸合作,生产了世界上第一条完全由人工智能设计的丝巾。不久,人们只需要在后台输入关键词,小冰就能为顾客设计一条专属丝巾,“每个人都能把世界上唯一的丝巾送给父母,同时饱含自己的深情,这个人类做不到,从这一点来说,有小冰太好了。”徐元春说。
在音乐领域,李笛介绍,小冰的音乐创作和人类一样,需要被激发灵感,比如一张图或者一段文字,创作的步骤也和人类差不多,用算法生成和弦,先定下主基调、情感、曲风,然后创作副歌,再作词、编曲,最后混音。
很多歌手的歌是在同一个和弦上写出来的,比如英国歌手阿黛尔,她红了以后,有人专门拿阿黛尔的和弦写歌,这个方法论对机器同样适用,也许会比人类做得更好——只要喂给机器足够的数据,机器完全可以写出一首和周杰伦曲风相近的歌来。
“为什么有那么多可以唱到一起的流行歌,为什么好多经典流行歌曲可以无缝连接,因为它们的和弦都一样。一些工业化的作曲人为了挣钱,用了AI的一点点基础理论,Ta找出市面上最火最红的那几首歌,列出来,哦,都是用这个和弦,我就在这个和弦上写歌,一天写好几首。一旦小冰的技术成熟到一定程度,以至于可以场景化、应用化,对于整个音乐行业的搅动会非常大,大批流水线的音乐人会失业。写出网红歌曲会是小冰特别擅长做的事。”尚雯婕说。
小冰团队最新的研究方向之一是训练小冰写剧本。科学家们觉得机器写小说比较困难,“我们的要求不是写一个看上去像小说的有点通顺的东西,我们的要求是故事必须是新的。”编一个新故事太难了。一个科学家最近追网剧《隐秘的角落》,琢磨这个剧的故事核,“他把他岳父岳母推下去,又被三个小孩看见了,大家会想这可怎么办?三个小孩会怎么做,会不会被杀人灭口?要让机器对人性有这么深的理解太难了,现在也没有可靠的数据能帮助小冰。”这位科学家想了一个折中的办法,在人类规定的情节下,机器是不是可以据此生成台词呢?
小冰团队和北京电影学院合作,学生写情节,机器写台词,反馈很好,很多学生说从机器的创造中获得了启发。在编剧圈,有很多影子写手,他们按照经验和惯性写台词,尤其在网剧领域,一旦小冰学会写台词,不久的将来,观看一部由小冰参与编剧的电视剧也不是没有可能。
科学家记得一段台词,情境是男孩和女孩告白,女孩不喜欢男孩,小冰是这样写的——
女孩说:“我不喜欢你,请你不要再纠缠我。”
男孩说:“可以说我爱你吗?”
女孩说:“只要你觉得好就可以,但请对着灌木丛讲话。”
- 蚂蚁数科联合浙大实验室,获NeurIPS 2024大模型隐私挑战赛赛道冠军2024-11-25
- 雕刻耐心 | 第18届中国投资年会·有限合伙人峰会在沪召开2024-11-25
- 探索未来之路 激发AI创新 “天翼云·息壤杯”高校AI大赛北京区域赛2024-11-24
- 万物智联AIoT2.0洞察:2025中国AIoT产业年会盛况回顾2024-11-22