标贝科技推出智能语音开放平台 提供语音合成与语音识别
开发者可以在平台操作界面创建多个智能语音应用
近年来,人工智能行业快速发展,智能语音市场也异常火热。无论是BAT、网易等互联网大厂,还是以讯飞为首的人工智能大企业,亦或者近些年在AI赛道上异军突起的中小企业,都在用开放平台的战略方式,试图笼络各开发者,建立属于自己的AI产业生态圈。
据相关数据统计,国内智能语音相关开放平台已有50多家,其中不乏垂直领域的技术型小公司。标贝科技作为一家深耕智能语音领域中小企业,在2021年4月6日,也正式宣布加入智能语音开放平台“大军”,进一步推动人工智能语音场景落地,全效助力开发者构建自身AI语音生态。
据了解,标贝开放平台汇集了标贝科技五年以来在智能语音领域取得的相关技术成果,以丰富的商业化AI语音能力、个性化效果,为开发者提供业界领先的人机对话技术调用,能快速解决开发者在语音交互相关技术开发难点、痛点问题,提高开发者智能化产品落地速度,大大节省其开放成本和时间。
两大服务,提升交互体验
目前,标贝开放平台提供的智能语音服务主要包括语音合成(TTS)与语音识别(ASR),开发者可以在平台操作界面创建多个智能语音应用,系统自动分配了语音识别和语音合成的全部服务到该应用。语音识别包括一句话识别、长语音识别、录音文件识别,语音合成可选择在线合成、离线合成、长文本合成三种,并可根据客户自身需求进行用量、音色、并发等接入试用。特别值得一提的是,离线引擎的开放,使标贝对智能电视等嵌入式设备厂商的服务更为全面。
在语音合成方面,标贝采用基于transfomer机制的高音质合成,综合利用声学和语言学参数,多音字的合成准确率更高,韵律停顿更加自然,整体的语音听感体验更接近场景化的真人表达。合成的接口全面支持多音字标注,手动校对发音,语速停顿调节等通用功能。语音识别方面,基于先进的端到端的深度学习算法,聚焦中文普通话近场识别,在安静环境下近字准确率超过97%。除了支持16k的设备端交互,还支持8k的客服场景电话语音识别。并支持通过热词更新方式,进行领域内特定词识别效果的快速优化。
全音库开放,支持多应用场景
标贝开放平台发布后将开放近60个音色,涵盖老人、儿童、青年男女音。每一种音色均使用海量音频数据训练而成,声音真实饱满、富有表现力,MOS评分达到业内领先水准。同时,平台支持中文、英文、中英混合、方言和多语种发音,可满足教育、新闻、有声阅读、泛娱乐等领域语音定制需求,并支持多语言、多情感同时使用。
简单兼容, 赋能开发者
与目前主流智能语音开放平台相同,标贝开放平台提供 WEB API 调用,Android、iOS 等平台 SDK 接入方式,平台基于B/S架构的管理平台,使开发者可根据需求同时创建多个应用,支持千万级并发,每个应用有独立的可视化数据统计,帮助开发者实时、精确地监测应用服务调用情况。
与此同时,标贝开放平台设有应用预警功能,通过预警管理,开发者可对调用频次、剩余用量、并发量和有效期限等使用状态进行设置,实现精细化管理。来自标贝科技的数据显示,该平台语音合成和语音识别的速度均达到行业领先水平,服务可靠性高达 99.9%。
除此之外,标贝开放平台非常注重交互感,无论是UI界面还是功能体验,都比较人性化,是目前最简单且最兼容的智能语音交互平台之一,致力于让各位开发者,使用方便、效率翻倍。
对于智能语音服务平台的上线,标贝开放平台相关负责人表示,“凭借在基础业务AI数据服务的长期积累,以及不断创新的技术研发投入,标贝科技智能语音交互技术已达到业内领先水平,希望通过标贝语音服务开放平台赋能各行业,共同开创更多语音交互场景,实现开放共赢。”据悉,标贝开放平台新注册的会员,可获得一定量的无限期免费服务及优惠。
- 如祺出行跑进智驾深水区 “数据闭环”为技术迭代提供更优解2024-11-19
- 字节视频生成模型 PixelDance上线即梦AI,用户可免费体验2024-11-18
- AIoT年会最新议程揭晓!院士/专家/大咖确认出席!这场年度盛会不容错过!2024-11-18
- 2024全球AIGC产业全景图谱及报告重磅发布2024-11-18