Siri和Alexa背后的女科学家逝世,是她让AI有了女声
女声合成之母,享年74岁
萧箫 发自 凹非寺
量子位 报道 | 公众号 QbitAI
“嘿Siri,你能帮我做点什么?”
“……”
Siri的“甜美女声”,现在已经司空见惯了。
但如果没有女科学家Ann Syrdal的努力,这种“合成女声”可能还需要更长的时间。
遗憾的是,7月24日,74岁的Ann Syrdal去世了。
这位被网友谐音为“Answer doll”(问答娃娃)的语音合成专家,曾经是美国电话电报公司(AT&T,拥有贝尔实验室)的首席技术研究员。
在美国电话电报公司研究期间,她开发出了“第一个真正高质量的女性合成声音”,这才有了后来的Siri和Alexa(亚马逊的语音助手)。
于是《纽约时报》评价说:她是Siri和Alexa背后的那个人。
事实上,虽然语音合成技术早已有之,1939年,AT&T的贝尔实验室就已经开发出了首批合成语音。
但,这些语音合成技术(TTS)基本只能合成男性的声音。
往后的40年间,计算机技术突飞猛进,合成女性语音的技术却一直停滞不前。
Siri的开发者Tom Gruber曾经表示:“那些声音听起来就像机器人说话一样。”
而Ann Syrdal的到来,才让合成女性声音有了质地的飞跃。
让机器发出“自然的”女声
自20世纪80年代中期,Syrdal开始研发女性语音合成系统。
Syrdal的同事、语言研究员h.s.Gopal曾表示:“那时候,所有人都认为女声只是男声的高频版本,但这种想法根本不起作用。”
事实上,由于女性声音的特点,例如更高的音调和更多的气音,会导致在电话和计算机里,女性的声音比男声更加难听懂。
据研究发现,即使是真人对讲,女性声音被听错的概率要比男性平均高出33%。
举个例子,当你在做英语听力时,有没有感觉到,男声听力题往往会比女声更容易听懂?
这也是为什么,电话行业中大多数计算机合成的声音听起来像男性。
然而,语音合成领域不可能只有男声。
事实上,部分有发声障碍的女性,一直更希望能以女性的合成声音与外界沟通;此外,也有人对女声更加敏感。
就在1990年,Syrdal开发了一种可以合成女声的系统,通过优化数据库中的声音,将女性合成声音听错的几率从67%降到了40%。
这其中,一个名为Julia的女性合成声音,就是Syrdal开发出来的。
Julia合成女声.wav来自量子位00:0000:27
可以听见,无论是发音还是流畅程度,都已经达到了非常不错的水平,当然,语调还有一点奇怪,不过已经非常逼真了。
与直接创作语音相比,Syrdal选择将真人女性的语音片段组成一个大型数据库,在准确标记、确保语音质量的前提下,将它们拼凑起来,找到组合的规律,便于组成新词和新的句子。
此外,她还建立并测试了人类计算机模型,试图理解人类是如何识别各种语音的。
而她一直以来研究的目标,是将这个错误率降到33%以下,甚至比真人女性声音被听错的概率还要低。
1998年,Syrdal研发出的「自然之声」系统(Natural Voices),在国际语音合成器竞赛中获得了第一名,这是这项竞赛的一个拐点——因为它使用了女性的声音。
现如今,采用这项技术的Siri和Alexa,已经同时提供了女性和男性的声音。
而在美国与日本,Siri的女性声音已经成为了“标配”,几乎所有iPhone手机采用的都是Siri的女声。
2008年,Syrdal被任命为美国声学学会的研究员,以表彰她对女性语音合成领域所做出的贡献。
「自然之声」项目的负责人Juergen Schoeter表示:“就像是有什么力量一直驱动着她,促使她去优化女性声音的质量。”
合成女性语音之母
Ann Syrdal于1945年12月13日生于明尼阿波利斯(Minneapolis),她的父母于霍尼韦尔认识,这是一家二战前就存在的科技巨头公司。
她的父亲是一名开发真空管与电子技术的物理学家与工程师,在她2岁的时候就离世了,母亲将她抚养长大。
事实上,Ann Syrdal考上明尼苏达大学时,并没有考虑过从事科学工作,直到一位心理学教授请她帮忙做一个有老鼠参与的实验,她才意识到自己热爱实验室工作。
随后,她在明尼苏达大学获得本科与博士学位,此后在麻省理工学院从事博士后的研究。
也是在麻省理工学院和皇家理工学院,她开始研究人类语言的机制,此后一钻研就是大半辈子,一直到2015年,仍然在坚持不懈地发表论文。
事实上,Ann Syrdal发表的论文数量不多,在Researchgate上显示的一共有55篇,这些论文一共被引用了1100余次。
然而,她在语音合成领域上做出的贡献却有目共睹。
对于Ann Syrdal本人来说,选择科研的动力,来自于她在MIT工作的那段时间。
“无论在哪个领域,似乎都能在这里找到那个领域的世界专家,这种激励的感觉几乎让人难以夜寐。”
Ann Syrdal的女儿表示,因为癌症的原因,她于7月24日在加利福尼亚圣何塞的家中离世。
参考链接:
https://www.nytimes.com/2020/08/20/technology/ann-syrdal-who-helped-give-computers-a-female-voice-dies-at-74.html
https://www.researchgate.net/scientific-contributions/7938035_Ann_K_Syrdal
https://www.reddit.com/r/technology/comments/idjjvc/ann_syrdal_who_helped_give_computers_a_female/
https://en.wikipedia.org/wiki/Ann_Syrdal
- 首个GPT-4驱动的人形机器人!无需编程+零样本学习,还可根据口头反馈调整行为2023-12-13
- IDC霍锦洁:AI PC将颠覆性变革PC产业2023-12-08
- AI视觉字谜爆火!梦露转180°秒变爱因斯坦,英伟达高级AI科学家:近期最酷的扩散模型2023-12-03
- 苹果大模型最大动作:开源M芯专用ML框架,能跑70亿大模型2023-12-07