使用NeMo让你的文字会说话-深度学习在语音合成任务中的应用 | 英伟达NLP公开课
语音合成技术可以将任何文字信息转换成标准流畅的语音且进行朗读,相当于给机器装了一张人工合成的“嘴巴”。它是涉及多个学科,如声学、语言学、数字信号处理和计算机科学的一个交叉学科。
英伟达NeMo是一个用于构建先进的对话式AI模型的工具包,它内置集成了自动语音识别 (ASR)、自然语言处理 (NLP) 和语音合成 (TTS)的模型及方法,方便调用先进的预训练模型、快速完成对话式AI中各类子任务。
我们可以通过NeMo快速、方便地实现文字与语音之间的转换,让我们的文字会说话!
7月28日,第3期英伟达x量子位NLP公开课中,英伟达专家将分享语音合成理论知识,并通过代码实战分享如何使用NeMo快速完成自然语音生成任务。
课程亮点:
快速入门:零基础AI爱好者也能快速上手。
一站式工具:学习对话式AI工具包集成的模型与方法,一站式处理语音语义各类子任务。
快速搭建:提供AI/NLP框架的现成接口,开箱即用,无需编码。
课程大纲
本次在线研讨会主要面向有语音语义和AI开发需求的开发者及零基础编程爱好者,通过本次课程,您可以获得以下内容:
- 语音合成技术简介
- 语音合成技术的工作流程和原理
- 语音合成技术中的深度学习模型
- 代码实战:使用NeMo快速完成自然语音生成任务
分享嘉宾
李奕澎(Yipeng Li),NVIDIA开发者社区经理。拥有多年的数据分析建模、人工智能自然语言处理方向的开发经验。在自动语音识别、自然语言处理、自然语言理解等技术有着丰富的实战经验与见解。
直播时间:
7月28日(周三),20:00-21:30
其中20:00-21:00知识讲解、代码演示,21:00-21:30答疑互动
免费报名:
报名链接:https://www.nvidia.cn/webinars/210728-598816/
△请准确填写您的邮箱、便于接收直播提醒&课程资料哦~
p.s.报名后请添加小助手、加入微信交流群,及时接收直播通知、课程PPT&代码,还可参与课后问卷,赢取《CUDA编程基础与实践》畅销书哦~
课程回顾
点击链接查看第1期课程回顾&直播回放:使用英伟达NeMo快速入门NLP、实现机器翻译任务 | 内附代码
点击链接查看第2期课程回顾&直播回放:使用英伟达NeMo快速完成NLP中的信息抽取任务 | 实战讲解,内附代
—完—
- 江行智能CTO樊小毅:AI+边缘计算驱动能源产业变革 | 量子位·视点分享回顾2022-03-15
- 天云数据CEO雷涛:从软件到数件,AI生态如何建立自己的“Android”?| 量子位·视点分享回顾2022-03-23
- 火热报名中丨2022实景三维创新峰会成都站将于4月13日召开!2022-03-21
- 从软件到数件,AI生态如何建立自己的“Android”?天云数据CEO直播详解,可预约 | 量子位·视点2022-03-11