前NASA工程师让钢琴开口说英文,还能自弹世界上最难曲目,快到冒烟
网友:圆梦了
金磊 发自 凹非寺
量子位 | 公众号 QbitAI
当一位前NASA工程师,遇到一架钢琴,会擦出怎样的火花?
以为就是弹弹琴?
年轻了。
他能让这架钢琴说!英!!语!!!
瞧,这台经过改良的钢琴Chopstix (筷子),跟他对话的画风是这样的:
而且不止是说英语,筷子还能轻松驾驭全世界最难的钢琴曲(快到冒烟的那种):
钢琴竟能“疯狂”如斯,引来不少网友们的围观:
不过这时你可能会问了,它出的声儿不还是钢琴的音吗?怎么就成“说英语”了呢?
别急,我们这就来扒一扒。
用傅里叶变换让钢琴说英语
这位前NASA工程师、油管博主叫做Mark Rober (下文简称“小马哥”)。
在他看来,我们人类的语音是可以用波形来进行可视化,例如这样:
但如果把其中的一小个片段放大,可以很简单地看到,这个波形的模式像是在“有节奏地重复”:
小马哥表示,对于任何信号,几乎都可以把它表示为纯正弦波的总和。
然后他就想到了利用信号处理领域中最受欢迎的工具之一——傅里叶变换。
于是,小马哥便把傅里叶变换用到了他的钢琴项目中:
只考虑音符所对应的峰值来重现声音。
以此类推,小马哥用这种方式对整段钢琴声音做了处理,就得到了对应的近似(不完全是)信号。
若是这种方式用对了,就可以得到这样的结果,例如小马哥对着钢琴说了一句:
Hey Chopstix!Repeat after me!
然后“筷子”就会用钢琴的声音来复述这句话:
当然,在这个期间,小马哥承认自己在这个过程中“作弊”了——利用了人类大脑的bug。
也就是说,若是闭上眼睛仅仅去听“筷子”弹的声音,我们很难去理解它在说什么。
但配上眼睛所看到的字幕,就会让人产生“好像真是这么一回事”的感觉。
小马哥对此解释说:
人类大脑在收集周围环境的信息中,有80%来源于视力。
即便我们在边听边看,视力依旧是在主导的感官。
……
而除了“说英语”外,作为一架钢琴,“筷子”在本职业务上也有较好的表现。
轻松驾驭世界最难曲子
小马哥在弹奏这件事儿上,给“筷子”挑了一首人类几乎无法演奏的曲子——《Rush E》。
这曲子有多离谱,看下谱子就知道了:
而大家都知道,钢琴在按下一个键后,即便手指释放了,还会有点延长音。
为了让钢琴的声音足够干脆利落,小马哥便对钢琴做了个改良。
如果只要求出声的话,最简单的构造是这样的,按下去,敲击到琴弦就行:
而为了做到按键释放的瞬间声音就停止,它现在变成了这样:
之后便来到了让“筷子”自己演奏这一环节。
小马哥表示,100多年前就有人实现了让钢琴自己演奏的功能,当时的方法是通过一张滚动的纸,由上面的打孔来控制钢琴的按键:
但这种方法的缺点,便是时间无法精准控制,而且按琴键的力度是“全力”。
因此,小马哥便搞了一排“螺线管”, 将它们一个个地安装到了刚才改良部件的下方:
这种螺线管不仅能精准控制时间,而且还能提供127种弹奏的力度,这就能在音效上逼近人类。
于是,“筷子”在种种改良的加持下,也就有了开头展示的、轻松驾驭超高难度《Rush E》的名场面了:
但其实最后的冒烟,是小马哥搞的效果而已。
而在有了多种能力之后,“筷子”也就能够实现自弹自唱了:
(一首Rick rolled送给大家)
网友:圆梦了
对于这样的一架钢琴,网友们表示出了感慨。
例如有人就表示“圆梦了”:
太疯狂了,我一直想看Rush E急速地演奏。
也有网友表示,“这也是第一次被一个会说话的钢琴Rick Rolled了”:
但讲真,这种脑洞大开的事儿,小马哥并不是第一次做。
毕竟身为前NASA工程师,技术过硬的他还曾经为了报复偷快递的人,自制了“臭屁炸弹”,把小偷们整得不要不要的……
想要了解小马哥更多有趣的项目,可以查看他的个人主页哦
参考链接:
https://www.youtube.com/watch?v=uBEL3YVzMwk
个人主页:
https://www.youtube.com/channel/UCY1kMZp36IQSyNx_9h4mpCg
- 大模型上了火山方舟:数据唯你可见,唯你所用,唯你所有2024-11-14
- Keras之父,离职谷歌2024-11-14
- OpenAI华人VP翁荔离职:北大校友,掌管安全,最近B站分享被热议2024-11-09
- 百度发布iRAG,李彦宏:AI行业最大变化是大模型基本消除幻觉2024-11-12