AI玩起音乐“天赋”惊人，听听新加州旅馆？还是熟悉的老鹰乐队嗓

赖可 2020-05-01 13:54:58 来源：量子位

赖可发自凹非寺
量子位报道 | 公众号 QbitAI

AI把一首歌重新唱一遍，会是什么感觉？还是那个歌手，还是那个歌词，却是全新的旋律，全新的风格。

先试听一下吧。

Eagles乐队的Hotel California，第一段还是原调，唱着唱着就突然变了：

音频播放器

00:00

使用上/下箭头键来增高或降低音量。

第一遍听没有听歌词，真的以为变成了另一首歌，最后还加了一段纯乐器：

On a dark desert highway，cool wind in my hairWarm smell of colitas

rising up through the airUp ahead in the distance

I saw a shimmering lightMy head grew heavy and my sight grew dim（开始变调）

I had to stop for the night

There she stood in the doorway

I heard the mission bell

And I was thinkin’ to myself ‘This could be heaven or this could be hell

(music……）

虽然不熟悉，还真的蛮好听，这个AI乐感不错呀！（反正超过我了）

最新的合成器：Jukebox

AI科学家一直在尝试，用神经网络合成语音和音乐。

上面的歌曲你也听过了，它是Open AI 最新研究出的神经网络：Jukebox。它将乐器和人声的混合的复杂音频，进行再处理，尽可能追求顺畅效果。

我们之所以选择音乐工作，是因为我们希望继续突破生成模型的界限。

它是怎么实现的呢？

Jukebox使用了一种称为VQ-VAE的量化方法，将音频压缩到离散空间。分层VQ-VAE可以从几个演奏的样本中生成简短的乐器片段。

分层处理

所谓的分层方法，就是分为三层将44kHz原始音频压缩为8x，32x和128x。主要有两个步骤。

压缩：每层都独立地进行编码。底层编码进行重构，而顶层编码只保留了基本的音乐信息。

生产：也是分层进行，一系列的transformers会从上到下生成代码，最后，下层的解码器将它们转换为原始音频。

当然，能生成目前效果的歌曲，也是因为数据库足够丰富，看一眼就知道了：

传送门

目前这个神经网络也有局限，产生不了常见大型音乐结构，例如和声和重复。科学家还在进一步努力中。

如果你想听更多其他AI制作的音乐样本，可以去官网试试：

https://openai.com/blog/jukebox/#rf7

一个小彩蛋：发现了一首深度学习之歌

Deep learning ，deep learning

The deeper you learn, the smarter your A. I.

Deep learning, big dataBig model, accuracy

We must, we must,we must go deeper…………

— 完 —

AI音乐加州旅馆模型生产

赖可

看「菊纹」，知疾病，这个智能马桶，知道你下半身的所有秘密2020-04-12
这拖拉机你能开算我输：美国少女“揭秘”现代拖拉机驾驶室2020-05-05
史上最大“云办公”实验开始，你参加了吗？2020-02-04
英伟达上线游戏云服务平台GeForce Now，每月4.99美元2020-02-05

AI玩起音乐“天赋”惊人，听听新加州旅馆？还是熟悉的老鹰乐队嗓

最新的合成器：Jukebox

分层处理

传送门

相关阅读

一代偶像终将老去，总有AI正在年轻

AI音乐战火升级！三路国产大军全面对决Suno

“音乐版Sora”首批演示泄露，网友：比写《宫保鸡丁》的Suno好10倍

全球首个AI流媒体音乐App来了！中国造的

让莫扎特“续写”披头士的音乐，OpenAI的新AI作曲能力强丨Demo可玩

热门文章

英伟达含量为零！华为密集模型性能比肩DeepSeek-R1，纯昇腾集群训练

联想百应智能体入选量子位“2025年值得关注的AIGC产品”：国内首个AI服务智能体打破中小企业AI落地困局

最强视觉生成模型获马斯克连夜关注，吉卜力风格转绘不再需要GPT了

DeepSeek引爆「万物皆可AI」时代，20余位大咖分析行业痛点，万字梳理干货在此

GPT-4.1淘汰了4.5！全系列百万上下文，主打一个性价比