全球首个AI流媒体音乐App来了!中国造的
支持中文,一直生成一直听
金磊 发自 凹非寺
量子位 | 公众号 QbitAI
全球首个AI流媒体音乐App,就这么水灵灵的来了。
有什么特点?
首先,如其名,这个App里的音乐都是由AI生成的。
其次,它是无限流式的,也就是说,可以做到一直生成一直听。
话不多说,我们直接来看效果。
例如我们的Prompt是:
Take a chilled walk with my dog.
和我的狗狗惬意地散步。
视频地址:https://mp.weixin.qq.com/s/30HmpWkChdG5jlAs2Bydjw
在上面的视频中,我们先是生成了一段10分钟的音乐。
而在这10分钟的时间里,围绕着“chill”的感觉,AI一共生成了四段不同人声的英文歌曲。
氛围不变,衔接毫无违和感,遛狗的时候根本不用停下来换歌。
看完效果和App的界面,你是不是想问这又是国外哪家公司打造的AIGC产品?
非也非也。
这个App正是国内公司昆仑万维最新打造的一个出海产品——Melodio,同时也支持网页版。
那么作为全球首个AI流媒体音乐平台,Melodio还有哪些玩法,我们来继续实测一番。
是支持中文的那种
Melodio目前已经在各大应用商店上架,和其它音乐软件一样,只需下载就可以开始使用。
它的使用方法也是极其的简洁,打开并登录(或注册)之后,界面是这样的:
最简单的方式就是输入你想听的音乐的Prompt,然后点击“Let’s vibe”(感受一下)即可。
例如我们这次输入:
动感音乐,DJ,健身,激情。
https://mp.weixin.qq.com/s/30HmpWkChdG5jlAs2Bydjw
整体听来,音乐是符合健身时候需要的那种动感韵律的。
除了像这种直接通过Prompt的方式生成之外,Melodio还提供了一种“歌曲参考”的模式:
然后我们这次在Prompt上再加大一下难度,让这个出海的产品生成一下中文歌曲:
伤感,中文,下雨天。
https://mp.weixin.qq.com/s/30HmpWkChdG5jlAs2Bydjw
仅音乐的氛围符合Prompt的要求,而且AI歌手对于中文的咬字也是非常的清晰,不看歌词也是完全没问题。
当然,如果你想查阅歌词,这个也是可以有,只需“右一屏”(主屏幕向右滑动)一下即可:
如果你想生成的音乐保存下来,点击主屏幕右下方的小爱心,近2分钟的音频就可以收入囊中喽~
除此之外,如果没有创作的灵感,或者想听一下大家都生成了什么样的音乐,Melodio的“左一屏”里还提供了音乐广场的功能。
在这里,你可以听到网友们创作出来的优质的AI音乐,包括轻快、激情等多个风格。
不过有一说一,Melodio还只是昆仑万维此次在AI音乐推出的产品之一。
还有一个击败Suno的AI音乐创作平台
没错,昆仑万维还推出了一个AI音乐创作平台——Mureka。
如果说Melodio更加适合听AI音乐,那么Mureka就是把AI创作音乐这事拔到了一个新高度。
操作上的门槛也是非常低,即使你从来没有创作过音乐也是完全可以hold住的那种:只需两步。
第一步,输入歌名歌词。
在左侧对应的输入框中,我们可以先把预先想好的歌名和歌词输入进去:
第二步,选择参考音乐。
这个过程中,我们可以选择平台自带曲库中的音乐,也可以自行上传本地音乐:
由于我们要生成中国古风音乐,因此参考音乐我们这次选择《甄嬛传》的主题曲《红颜劫》。
上传完毕后,我们还可以对音乐的风格、情绪,以及参考的片段(30秒)做自定义的选择:
最后点击“Create”,只需等待1分钟左右的时间,Mureka就会提供生成的2个版本音乐:
版本1效果如下:
https://mp.weixin.qq.com/s/30HmpWkChdG5jlAs2Bydjw
版本2是这样的:
https://mp.weixin.qq.com/s/30HmpWkChdG5jlAs2Bydjw
Mureka生成的音乐并不是“一次性”的,而是可以针对某个片段进行二次AIGC的那种:
以及Mureka默认生成的音乐长度是2分钟左右,如果想继续让AI生成,则只需填写更多的歌词即可:
最重要的一点是,用Mureka生成的音乐,是可以卖的,而且是具有创作证明的那种!
不过有一说一,类似Mureka这样的AI音乐创作平台并非是首款,毕竟像此前较火的Suno和Udio便早已推出。
那么二者相比,到底孰强孰弱?
对于这个问题,国外已经有博主做了一期将近20分钟的体验和教程视频,在此之后,他得到的总结就是:
Mureka,比Suno和Udio还要好。
那么接下来的一个问题是:
怎么做到的?
对于这个问题,昆仑万维也给出了他们的解法——
音乐领域中的类Sora架构。
这个架构可以分为两个主要的部分。
首先是Large-scale Transformer,这一模块的功能是负责谱曲,来学习 Music Patches 的上下文依赖关系,同时完成歌曲创作和控制。
而另一个Diffusion Transformer是负责演唱部分,通过DiT让Music Patches被还原成高质量音频,可以支持生成 6分钟44100Hz采样率双声道立体声歌曲。
由此,昆仑万维也比较了在这套架构之下,模型所取得的最新成绩:
据了解,Mureka的新模型在人声维持领先水平,在音质、自然度和发音可懂度上都达到行业SOTA水准。
同时在其他更细化的音乐性指标(动机质量、伴奏质感、配器丰富度、音乐结构性和混音质量)上也有大幅提升。
这也就不难理解为何Melodio和Mureka是经得起各大博主实测的产品了。
不过在最后的最后,还有一个问题值得说道说道。
那就是昆仑万维作为一个中国企业,为何会在AI音乐领域pick出海这个赛道。
其实若是把昆仑万维的“履历”铺开来看,出海,早已成为这家公司基因的一部分:已有足足16年的经验。
昆仑万维目前旗下业务覆盖AGI与AIGC、信息分发、元宇宙、社交娱乐及游戏等多个领域
其市场遍及中国、东南亚、非洲、中东、北美、南美、欧洲等地。截至目前,全球平均月活跃用户近 4 亿, 海外收入占比达86%。
而步入大模型时代,昆仑万维放眼全球也是最早一批全面布局于此的玩家。
旗下的Skywork(天工智能)已经囊括了六大AI业务矩阵,包括AI大模型、AI搜索、AI音乐、AI视频、AI社交、AI游戏等。
其产品“天工”APP也已然全面整合了AI搜索、AI阅读、AI创作等核心功能,覆盖了工作、学习和生活等多个应用场景。
这也正是在AI音乐领域迅速崛起之际,昆仑万维能够以最SOTA的姿势挺进海外市场的原因了。
不过总而言之,随着Melodio和Mureka的正式发布,可以说是让热爱音乐的小伙伴们把创作这件事儿的门槛狠狠地打了下去。
不仅如此,即便是对于专业的音乐领域工作者,这些AIGC工具也为他们的创作灵感提供了一定的动力。
- Keras之父,离职谷歌2024-11-14
- 大模型上了火山方舟:数据唯你可见,唯你所用,唯你所有2024-11-14
- OpenAI华人VP翁荔离职:北大校友,掌管安全,最近B站分享被热议2024-11-09
- 百度发布iRAG,李彦宏:AI行业最大变化是大模型基本消除幻觉2024-11-12