AI玩起音乐“天赋”惊人,听听新加州旅馆?还是熟悉的老鹰乐队嗓
赖可 发自 凹非寺
量子位 报道 | 公众号 QbitAI
AI把一首歌重新唱一遍,会是什么感觉?还是那个歌手,还是那个歌词,却是全新的旋律,全新的风格。
先试听一下吧。
Eagles乐队的Hotel California,第一段还是原调,唱着唱着就突然变了:
第一遍听没有听歌词,真的以为变成了另一首歌,最后还加了一段纯乐器:
On a dark desert highway,cool wind in my hairWarm smell of colitas
rising up through the airUp ahead in the distance
I saw a shimmering lightMy head grew heavy and my sight grew dim(开始变调)
I had to stop for the night
There she stood in the doorway
I heard the mission bell
And I was thinkin’ to myself ‘This could be heaven or this could be hell
(music……)
虽然不熟悉,还真的蛮好听,这个AI乐感不错呀!(反正超过我了)
最新的合成器:Jukebox
AI科学家一直在尝试,用神经网络合成语音和音乐。
上面的歌曲你也听过了,它是Open AI 最新研究出的神经网络:Jukebox。它将乐器和人声的混合的复杂音频,进行再处理,尽可能追求顺畅效果。
我们之所以选择音乐工作,是因为我们希望继续突破生成模型的界限。
它是怎么实现的呢?
Jukebox使用了一种称为VQ-VAE的量化方法,将音频压缩到离散空间。分层VQ-VAE可以从几个演奏的样本中生成简短的乐器片段。
分层处理
所谓的分层方法,就是分为三层将44kHz原始音频压缩为8x,32x和128x。主要有两个步骤。
压缩:每层都独立地进行编码。底层编码进行重构,而顶层编码只保留了基本的音乐信息。
生产:也是分层进行,一系列的transformers会从上到下生成代码,最后,下层的解码器将它们转换为原始音频。
当然,能生成目前效果的歌曲,也是因为数据库足够丰富,看一眼就知道了:
传送门
目前这个神经网络也有局限,产生不了常见大型音乐结构,例如和声和重复。科学家还在进一步努力中。
如果你想听更多其他AI制作的音乐样本,可以去官网试试:
https://openai.com/blog/jukebox/#rf7
一个小彩蛋:发现了一首深度学习之歌
Deep learning ,deep learning
The deeper you learn, the smarter your A. I.
Deep learning, big dataBig model, accuracy
We must, we must,we must go deeper…………
— 完 —
- 看「菊纹」,知疾病,这个智能马桶,知道你下半身的所有秘密2020-04-12
- 这拖拉机你能开算我输:美国少女“揭秘”现代拖拉机驾驶室2020-05-05
- 史上最大“云办公”实验开始,你参加了吗?2020-02-04
- 英伟达上线游戏云服务平台GeForce Now,每月4.99美元2020-02-05