[发明专利]语音识别的方法、客户端及终端设备在审

申请号：	201410817478.3	申请日：	2014-12-24
公开（公告）号：	CN105786880A	公开（公告）日：	2016-07-20
发明（设计）人：	谢志华	申请（专利权）人：	中兴通讯股份有限公司
主分类号：	G06F17/30	分类号：	G06F17/30;G10L15/26
代理公司：	北京银龙知识产权代理有限公司 11243	代理人：	许静;黄灿
地址：	518057 广东省深圳市南山***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音识别方法客户端终端设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及通信技术领域，尤其涉及一种语音识别的方法、客户端及终端设备。

背景技术

随着语音成为大众熟知的交互方式之一，各种语音识别软件在市面上不断涌现，语音识别软件的质量也参差不齐，而衡量语音识别软件质量的标准之一就是语音识别率。虽然现在云端识别情况下，各语音识别引擎提供商提供了自然语义理解的功能，但各引擎提供商提供的能力不一，都还没有办法完全理解不同人，不同场景下的语义。所以，如何根据当前终端场景下正确识别用户的语义，提高语音识别准确率，最终实现最佳的语音用户体验就显得很有意义和价值。

现在大多数引擎提供商采用的方法一般都是在云端服务器上用语言模型等，经过一定的算法，对用户的语音进行处理，最终得到用户的意图并告知该用户，但很多时候，由于某些特定说法具有多义性，云端服务器也没有办法得到唯一的结果，就会造成反馈给用户的结果可能与用户期望的实际结果有差距，从而给用户的感觉是识别不准，用户体验不佳。

发明内容

为了解决上述技术问题，发明的实施例提供了一种语音识别的方法、客户端及终端设备，对初步的语音识别结果结合当前场景进一步优化，从而让语音结果更佳符合当前用户的期望，提升用户的语音交互体验。

依据本发明的一个方面，提供了一种语音识别的方法，应用于终端设备侧，所述方法包括：获取用户输入的语音的原始语音识别结果，并根据所述原始语音识别结果解析出所述用户的语音识别场景，其中所述原始语音识别结果由云端服务器根据所述用户输入的语音识别得到；根据所述语音识别场景，从所述原始语音识别结果中获取需要校正的关键词信息和每个所述关键词信息中的多音字；根据所述需要校正的关键词信息和每个关键词信息中的多音字生成一个或多个包含所述多音字的垃圾词；根据所述语音识别场景或所述需要校正的关键词信息所属的范围，获取所述终端设备中的与所述语音识别场景或所述需要校正的关键词信息对应的实际信息，并将所述垃圾词与所述实际信息进行匹配，筛选出正确的多音字，将所述正确的多音字填充到所述需要校正的关键词信息中，得到正确的关键词；根据所述正确的关键词生成符合当前语音识别场景的最终语音识别结果。

可选地，所述根据所述原始语音识别结果解析出所述用户的语音识别场景，具体为：根据预先设置的语音识别结果与场景对应表，匹配得到与所述原始语音识别结果对应的所述用户的语音识别场景。

可选地，所述根据所述语音识别场景，从所述原始语音识别结果中获取需要校正的关键词信息和每个关键词信息中的多音字，具体包括：根据所述语音识别场景和预先设置的场景关键信息提取表，从所述原始语音识别结果中获取需要校正的关键词信息；判断所述需要校正的关键词信息中是否存在多音字，如果有，则获取每个关键词信息中的多音字。

可选地，所述根据所述需要校正的关键词信息和每个关键词信息中的多音字生成一个或多个包含多音字的垃圾词，具体包括：将所述多音字转换成对应的拼音，然后根据同音字对应表，提取出所述拼音对应的一个或多个汉字；将所述汉字填充到所述需要校正的关键词信息中替换多音字以组成得到一个或多个包含多音字的垃圾词。

可选地，所述语音识别结果与场景对应表和场景关键信息提取表的格式为 XML可扩展标记语言。

依据本发明的另一个方面，还提供了一种语音识别的客户端，应用于终端设备侧，所述客户端包括：场景解析模块，用于获取用户输入的语音的原始语音识别结果，并根据所述原始语音识别结果解析出所述用户的语音识别场景，其中所述原始语音识别结果由云端服务器根据所述用户输入的语音识别得到；多音字提取模块，用于根据所述语音识别场景，从所述原始语音识别结果中获取需要校正的关键词信息和每个所述关键词信息中的多音字；垃圾词生成模块，用于根据所述需要校正的关键词信息和每个关键词信息中的多音字生成一个或多个包含所述多音字的垃圾词；多音字校正模块，用于根据所述语音识别场景或所述需要校正的关键词信息所属的范围，获取所述终端设备中的与所述语音识别场景或所述需要校正的关键词信息对应的实际信息，将所述垃圾词与所述实际信息进行匹配，筛选出正确的多音字，将所述正确的多音字填充到所述需要校正的关键词信息中，得到正确的关键词；结果处理模块，用于根据所述正确的关键词生成符合当前语音识别场景的最终语音识别结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司，未经中兴通讯股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201410817478.3/2.html，转载请声明来源钻瓜专利网。

上一篇：自适应电子书刊文件结构以及相应的方法及装置
下一篇：一种数据存储方法、系统及查询方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音识别的方法、客户端及终端设备在审

专利文献下载