[发明专利]智能语音服务开发云平台及方法在审
申请号: | 201410779258.6 | 申请日: | 2014-12-15 |
公开(公告)号: | CN104538031A | 公开(公告)日: | 2015-04-22 |
发明(设计)人: | 张华;刘升平;李鹏;刘青松;梁家恩 | 申请(专利权)人: | 北京云知声信息技术有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/183;G06F17/30 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 南毅宁;桑传标 |
地址: | 100191 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 智能 语音 服务 开发 平台 方法 | ||
技术领域
本发明涉及语音服务开发领域,具体地,涉及一种智能语音服务开发云平台及方法。
背景技术
让智能家电、汽车、智能玩具、互联网等智能产品获得理解自然语音及语言的能力,能够与用户进行自然对话,是智能产品发展的一大重要趋势。与此同时,语音识别、语义理解、语音合成等专业性技术也逐渐产业化、实用化。在这样的产业需求下,多家语音技术公司都推出了各自的智能语音开发云平台,将基于云端的智能语音交互技术开放给开发者,从而使普通应用开发者能够便捷高效地开发具有语音交互能力的产品。
在现有的智能语音开发云平台中,应用开发者可以创建一个支持智能语音交互的应用,通过下载SDK(软件开发工具包),能够调用平台的语音识别、语义理解和语音合成等服务。然而现有平台存在的问题是开发者难以实现对特定应用的优化。
开发者的应用往往是面向特定领域的,如医疗领域的病例语音转写,餐饮领域的语音点菜,金融领域的基金语音查询等等,而智能语音开发云平台又是通用的,面向所有开发者的。这导致特定应用的智能语音交互效果会受到很大影响,特别是对一些领域特定词汇,如金融领域的基金名称,医疗领域的药品名称,语音识别效果都不够理想。因此,开发者有很大的针对其应用的优化需求。
对开发者的优化需求,现有的智能语音开发平台很难及时满足。通过现有的智能语音开发平台,当发现有语音识别、语义理解或语音合成错误时,开发者无法自行优化,因现有的智能语音开发平台没有提供优化功能,开发者只能联系平台的技术支持人员,反馈问题,然后由平台技术支持人员再反馈给公司的平台开发人员,对公有云服务进行后续优化。这种解决方法耗时长、无法及时解决应用的优化需求。此外,在后台实施优化时,需要开发者对语音识别、语义理解、语音合成等这些服务的技术原理有比较清晰的了解,并且需要开发者逐一对各个服务引擎做优化。这样大大增加了优化实施的门槛,增加了开发者的优化开发难度。
发明内容
本发明的目的是提供一种能够实现对应用进行优化定制的智能语音服务开发云平台及方法。
为了实现上述目的,本发明提供一种智能语音服务开发云平台。该开发云平台包括:应用优化数据库;内容服务优化模块,用于接收用户针对已创建的应用定制的输入句式和与该输入句式对应的输出数据,并将所述输入句式和所述输出数据存储到所述应用优化数据库;语音识别模块,用于从所述应用优化数据库获取所述输入句式,并根据所获取到的输入句式来更新语音识别模型;以及语义理解模块,用于从所述应用优化数据库获取所述输入句式和所述输出数据,并根据所获取到的输入句式和输出数据来更新语义理解模型。
优选地,该开发云平台还包括:同义词优化模块,用于接收用户针对所述已创建的应用定制的同义词,并将所述同义词存储到所述应用优化数据库。
优选地,所述内容服务优化模块还用于在接收到所述输入句式之后,先对所述输入句式进行解析以确定该输入句式是否包括标注有同义词符号的词语,并在所述输入句式包括标注有同义词符号的词语的情况下,从所述应用优化数据库中查询与该词语相关的同义词,并根据所查询到的同义词对所述输入句式进行扩展,之后,再将扩展后的输入句式存储到所述应用优化数据库。
优选地,所述输出数据包括用于表示与所述输入句式对应的语义解析结果的第一信息元素,以及用于表示是否需要返回与所述输入句式对应的应答数据的第二信息元素。
优选地,所述语义理解模块还用于在所述输出数据中的所述第二信息元素表示需要返回所述应答数据的情况下,根据所述第一信息元素所表示的语义解析结果来确定要返回的应答数据所来自的应答数据源,并将该应答数据源与所述输出数据相关联。
优选地,该开发云平台还包括:应答数据源优化模块,用于接收用户针对所述已创建的应用定制的应答数据源,并将该应答数据源存储到所述应用优化数据库;以及所述语义理解模块根据所述第一信息元素所表示的语义解析结果来从所述应用优化数据库中确定要返回的应答数据所来自的应答数据源。
优选地,所述开发云平台还包括:语音识别优化模块,用于接收用户针对所述已创建的应用定制的词典数据,其中,该词典数据包括词典名称和词条,并将该词典数据存储到所述应用优化数据库;以及所述语音识别模块还用于从所述应用优化数据库获取所述词典数据,并根据该词典数据更新所述语音识别模型。
优选地,所述词典数据还包括与所述词条对应的发音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京云知声信息技术有限公司;,未经北京云知声信息技术有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410779258.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音识别方法及系统
- 下一篇:封闭空腔有源结构声控制方法