全球首部AI交响变奏曲问世,AI技术应用再拓边界
郭一璞 发自 凹非寺
量子位 报道 | 公众号 QbitAI
人工智能技术,史上第一次升级到了复杂音乐的创作领域:交响曲。
全球首部AI交响变奏曲《我和我的祖国》,昨晚已由深圳交响乐团全球首演,它的出品方是中国平安人工智能研究院。
此前,你可能了解过Google的Magenta、OpenAI的MuseNet这些音乐创作AI,它们主要是在有限的声部范围内,模仿莫扎特、Lady Gaga这些音乐家或歌手的风格,创作出简短的音乐Demo。
但这次,平安将AI创作音乐的能力,从单旋律的流行乐,突破到了交响曲的范围,原先只能写一小段Demo旋律,这次一下子能写7个乐章了,而且是可以直接拿来演出的成熟作品。
整部交响曲时长12分钟,你可以听到风琴、小提琴等多种音色,还有主旋律、伴奏、鼓点节拍多个不同的声部,整体非常丰富,一般人根本听不出来是AI作的曲,就好像专业的人类音乐家作品一样。
深圳交响乐团音乐总监兼首席指挥林大叶在音乐会演出前,激昂地表示,将为现场观众带来一首特殊的作品作为本季音乐会的开场,该首管弦乐作品《我和我的祖国》由AI编曲创作,并于今日世界首演。中国平安开拓了一个完全崭新的领域,开创了一个时代。
“过去10年甚至20年前的时候,3D动画刚刚进入人们的视野,或许存在多样缺点。但是经过短暂的发展,如今3D动画已经非常超前和逼真。”林大叶进一步表示,由人工智能技术进行编曲的音乐,今天也是一个起点。“期待未来5—10年,AI可以创作出传世的交响乐作品。”
在这部交响曲面世前,平安已经在AI音乐方面探索了两年,早已熟悉了流行音乐的创作,这次选择了交响乐这个复杂的音乐流域,也是AI在艺术创作方面的技术突破。
而除了音乐之外,在绘画、作诗等各个艺术领域,平安的人工智能技术也有不少积累。
相比重在产业落地的AI公司们,平安这家金融科技公司倒是与众不同,偏爱在人类的精神世界下功夫。
AI叙述:交响变奏曲讲述中国百年近现代史
作为变奏曲,这部曲子是在《我和我的祖国》原本的曲调上,加以变幻演绎而创作的。
或许对乐章乐理不熟悉,你不太能感受到AI应用厉害之处。
先说说内容吧。
开头是《我和我的祖国》旋律,以此引出从近代到我们现在的辉煌历史。
第一段变奏带我们回到了百余年前,从鸦片战争开始,中华民族进入了一段艰难岁月,旋律变得缓慢悲怆,让你觉得仿佛那些在压迫下艰难谋生老百姓们就在眼前,日复一日地重复着艰苦的岁月。
不久之后,曲调变得昂扬向上、充满希望,仿佛星星之火燎原,被压迫的先辈们团结起来,谋求翻身做主人。
第二段变奏伊始,一段唢呐声划破天际,音乐也变成了信天游的味道。
这里是延安的故事。一阵富有节奏感的欢快音乐,展示出男女老师齐上阵,一同劳作奋斗的景象。
之后的节奏忽然变得雄壮激昂,军鼓点密集的敲响,胜利来临了,新中国成立了。
转入第三段变奏,是低沉的进行曲,配合坚韧的步伐,吹响了抗战的号角。
当一系列风风雨雨终于过去,改革开放的春天到来,交响曲也走入了第四段变奏。悠扬的提琴声如春风拂面,多个声部一唱一和,迸发出希望和生机。
随后便是第五段变奏,节奏铿锵有力,曲调逐渐高昂,呼应着中华民族伟大复兴的脚步。
五段变奏曲,讲述了中华民族的百年大国崛起历史。之后回顾过往,当《我和我的祖国》旋律再次响起,整部交响曲也取得了圆满。
整体听下来,仿佛看了一部革命史诗,让人不由得感叹奋斗的艰辛和成就的喜悦。如果不是音乐专家,一般人根本听不出来这是由AI谱写的曲子,和音乐家凭借经验和专业能力创作的乐曲内容相似度极高。
AI创作:八个维度自研模型,比生成语言更难
那么,这样一首曲子,是怎么由AI创造出来的呢?
据AI交响变奏曲《我和我的祖国》曲目团队技术负责人介绍,AI作曲技术背后是平安首创的AVM自动变奏模型,其中用到了VAE,Transformer,GPT-2等语言模型。
首先在节奏、和声、织体、配器等方面构建专家变奏规则库进行基础模型的训练。而后采用深度学习和强化学习联合方案,根据音乐创作理论描述规则进行基础模型训练,利用深度学习技术对音乐作品实现多维度的特征学习与提取,再结合强化学习技术让机器初步掌握人类作曲的思考逻辑,学习乐曲变奏手法。
不过,虽然用到的都是语言模型,但生成音乐和生成语言还是大不相同的。
团队负责人说:“说话都是我一个人在说,但音乐尤其交响乐就像一群人在说,大家七嘴八舌,谁先谁后,你是什么声域,我出什么音色,这是非常复杂的一件事。”
而且,AI创作交响曲,和创作简单的一段旋律不同,需要考虑音乐的主题、发展手法、和声、曲式等八个维度,技术难度更上一级。
而在数据方面,技术团队介绍,平安AI积累了六大数据库,有囊括百万首歌曲的乐曲库,包含歌词、诗词、散文等各种文学作品的歌词素材数据库,包含各种作曲要素和元素的专家规则库,乐器声、人声两大声源库,以及用户消费行为跟踪数据库,用于分析用户听到音乐后的情绪反馈。而本首AI交响变奏曲的创作,运用了其中70万余首乐曲进行结构化训练。
有了这些做基础,AI系统就可以按照你的需求自动生成相应的乐曲了。
整个生成过程的开始,需要输入《我和我的祖国》原曲调,之后结合每个变奏部分需要表达的历史事件,输入相应的情感表达需求,比如“悲愤”、“欢快”等,之后AI就可以自动输出可以直接听的成品的变奏曲音乐。
由于AI生成的曲谱中有一些旋律是人类无法演奏的,比如人类的一只手无法同时按下钢琴上离得很远的两个按键,小号上有一些键不能同时按下,因此后期为了能够实现乐曲的实地演奏,平安人工智能研究院在创作的过程中,辅以部分专家规则,避免乐曲创作过度自由和无序。例如,融入了和声约束、对位约束、曲式结构约束等,让AI作曲无限靠近原本体裁,让乐曲具备可演奏性和传承性。
AI探索:从AI作曲到商业化落地
其实,在AI音乐方面,平安已经有两年的积累,此前曾用AI创造流行音乐作品《青春记忆》,拿到了清华大学主办的全球AI艺术大赛一等奖;还研究过爵士乐,在瑞士联邦理工学院举办的国际AI作曲大奖赛上荣膺桂冠。
成绩背后,是平安巨大的AI人才团队。
技术团队负责人介绍说,直接参与到交响曲创作的算法工程师就达到了三十多位,还有两三百人的支持团队,其中大量主创团队成员既懂算法,也懂音乐。要知道,中央音乐学院的AI博士也是今年才刚刚开招,懂AI也懂音乐的人可以说少之又少,平安的人才储备实属难得。
任何竞争最后都是人才的竞争,人才的储备、技术的积淀,为人工智能技术边界在传统认知中大量应用于产业制造领域之外,实现了多角度突围,率先迈入人类意识形态领域,利用人工智能无形之手,实现精神世界的精彩纷呈。
巨大的人才团队,也在创造切实可用的商业价值。
最近,平安就将AI作曲技术应用到了刚刚结束“平安920”金融生活消费节的获客层面,提供包括AI作曲在内的各种互动项目,通过趣味活动丰富用户的体验感,吸引用户注意力,降低获客门槛,强化获客场景,从而提升核心主业的业务价值。
获客仅仅是AI音乐辅助平安主业发展的角度之一。此外,在AI辅助音乐领域发展,突围行业边界层面未来或将落地于音乐创作、音乐教育等范畴,全面打开了对于音乐这一情感语言表达方式的想象空间。
而下一步,技术团队介绍说,除了人类的音乐,平安还在考虑将将AI音乐延展到鲸鱼、鸟类等生物音乐学方面,创作更丰富的成果。
而除了作曲之外,平安还将AI落地在了写诗、绘画等多个领域。比如借助“神笔小安”小程序,通过对于用户上传图片的识别进行情绪的判断,结合背后海量的诗句数据库,可自行生成现代诗和古代诗两种符合图片风格的诗句。
比如这张夜晚路灯下的树木,平安AI就赋诗一句:
“杨柳夹城东,金峰一径通。”
AI突围:从内部赋能到外部输出
需要刷新印象的,或许不止是AI最新技能的认知。
也是时候重新认知前沿AI技术开拓方,无论是全球科技巨头,还是新晋的互联网后期之秀,已越来越多的将触角和目光聚焦在这一领域,人工智能+音乐已经成为全球范围内不可逆的发展趋势之一。
比如中国平安,是创办于1988年的中国第一家股份制保险公司,如今是全球金融领域市值最大的综合金融服务集团。
但传统金融主业之外,此次贺新中国成立70周年专项打造的AI交响变奏曲,是其AI实力的冰山一角。
过去10年,平安在AI领域的投资可谓大手笔,不仅成立了AI研究院,而且在AI创新和研究方面已持续拓展也已持续拓展多年。,并且在不久前的世界人工智能大会上,中国平安被科技部授予普惠金融新一代人工智能开放创新平台建设资质,人工智能技术获得了国家的认可,成功晋级AI国家队。
在底层技术研究方面,平安在语音语义、图像识别、结构化数据建模、知识图谱技术上都有均有深厚积淀,目前已拥有各类科技专利累计达18050项,未来还将持续将营收的1%投入科技研发。
在海量数据积累层面,平安构建了多领域知识图谱,例如,金融知识图谱层面,纳合了超过9.1亿的关系总数,1.21亿+人物实体,2.3亿+关系节点,还有超过3000万的企业数据;而医疗知识图谱包含了超过50万的医学术语、超过500万的医学关系,以及1000万+的医学证据。
这些丰富的技术基础和资源,都为平安的业务提供了助力。
现在,平安已经将AI应用到了医疗健康、金融风控、投资、宏观经济分析等具体的业务层面。
一方面对于内部业务推进全方位赋能。
例如在科技赋能寿险业务层面,在筛选保险代理人时,起到辅助作用的AI面谈官面试覆盖率达100%,高仿真对话机器人“AskBob”对代理人咨询的疑问解答准确率高达95%,任务查询和智能办理功能覆盖代理人90%常用需求。
平安产险则运用自主研发的AI图片定损技术和精准客户画像技术,针对安全驾驶行为良好的车主推出“信任赔”服务,开创性实现后台零人工作业模式,案均赔付完成时间缩短至168秒。
平安银行则建立了覆盖贷前、贷中、贷后全流程的智慧风控平台,实现了智能决策、智能控制、智能预警、智慧管理、智能放款五大智能应用。
最新数据显示,平安银行的AI语音客服替代率已达到80%以上,大幅提升了客服效率。
另一方面对外生态赋能输出层面,也将AI技术全方位融入多领域端到端一体智能解决方案之中,依托这一形式将技术输出给了中小银行、中小保险公司、金融机构、医保局和医院等机构,也借助智慧城市业务,为政府在优政、兴业、惠民三大领域提供智慧化服务。
智能营销、智能贷款、智能风控、智能客服、智能闪赔等海量智能解决方案受到中小金融机构的广泛青睐。财报数据显示,平安旗下金融壹账通对外赋能企业已达到3707家,其中包括615家银行、81家保险公司、3011家其他非银金融机构。
而在落地之外,这家金融科技公司也有拓展人类技术边界的情怀一面,AI创作交响曲,正是如此。
当然,这家综合金融巨头,也快速融入AI技术公司的“传统”:
据技术团队透露,AI作曲运用的平安首创AVM自动变奏模型,将会在明年初开源。
感兴趣的你,到时候也能站在前辈的肩膀上打造专属于自己的AI交响乐曲了。
— 完 —
- 小猿学练机推彩墨版 搭载专属教育大模型2024-12-18
- 12/21来成都!携手多点、TuGraph、DB-GPT社区一起玩转 DB+AI2024-12-16
- 第五届长沙·中国1024程序员节,即将震撼来袭!2024-10-14
- 国产全AI游戏来了?!大模型直出开放世界游戏,有声可交互2024-12-13