[发明专利]一种语音控制指令生成方法、装置及电子设备有效
申请号: | 201910449619.3 | 申请日: | 2019-05-28 |
公开(公告)号: | CN110232923B | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 马宏 | 申请(专利权)人: | 海信视像科技股份有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/22 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 266555 山东省青*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 控制 指令 生成 方法 装置 电子设备 | ||
本发明公开了一种语音控制指令生成方法、装置及电子设备,包括:根据接收到的语音信息获取待输出的文本,识别待输出的文本中的数字及数字在文本中的位置;将该位置的数字分别转换为中文数字和阿拉伯数字,确定不同的候选文本;根据每个分词的权重及分词的长度,确定候选文本的得分并确定文本识别结果,将文本识别结果及预先设定的标准文本进行匹配,根据匹配成功的标准文本生成语音控制指令。由于在本发明实施例中,通过将识别的数字在文本中的位置处的数字分别转换为中文数字和阿拉伯数字,确定不同的候选文本,并计算每个候选文本的得分,根据候选文本的得分确定到的文本识别结果更加准确,从而可以保证后续生成的语音控制指令的准确性。
本申请要求在2019年05月09日提交中国专利局、申请号为201910383416.9、申请名称为“一种文本识别方法、装置及电子设备”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种语音控制指令生成方法、装置及电子设备。
背景技术
语音识别技术可以实现从语音信息向文字信息的转化,即根据语音信的识别结果可以生成对应的语音控制指令,在转化时需要基于声学模型解码、语言模型解码等处理。语言模型是最终识别文本的一个重要参考标准,语言模型根据训练语料中中文文本的出现概率来决定识别文本的一种模型。而现有的语音识别的方法导致语音识别的准确性难以达到理想水平,语音识别的结果经常出现错误,这将会增加后续的语义理解的工作难度,并可能导致生成错误的语音控制指令。
在进行语音识别时,数字识别是语音识别的一部分,数字一般包括中文数字和阿拉伯数字。因为在进行语音识别时是基于语言模型的,因此语言模型训练语料中中文数字和阿拉伯数字出现的比重大小将决定数字的识别形式。如果识别出的文本中数字形式识别错误,将导致包含数字的实体词整体无法有效提取和标注,进而影响语义的整体理解,并可能生成错误的语音控制指令。因此一种可靠的语音控制指令生成方法,将会有效的提高语音理解的准确性。
发明内容
本发明实施例提供了一种语音控制指令生成方法、装置及电子设备,用以解决现有技术生成语音控制指令的过程中,在进行文本识别时数字形式识别错误,导致生成的语音控制指令的准确性较低的问题。
本发明实施例提供了一种语音控制指令生成方法,所述方法包括:
根据接收到的语音信息获取待输出的文本,识别所述待输出的文本中的数字及所述数字在所述文本中的位置;将所述待输出的文本中所述位置的数字分别转换为中文数字和阿拉伯数字,确定不同的候选文本;
根据候选文本分词后每个分词的权重及分词的长度,确定候选文本的得分,根据候选文本的得分确定文本识别结果;
将所述文本识别结果及预先设定的标准文本进行匹配,根据匹配成功的标准文本生成语音控制指令。
进一步地,所述识别待输出的文本中的数字及所述数字在所述文本中的位置包括:
将所述待输出的文本中的第一个字符作为待检测的字符;
采用当前长度的滑动窗口滑动到所述待检测的字符,判断该滑动窗口内的字符串是否为满足数字规则的字符串;
如果是,对记录的所述待检测的字符对应的字符串在所述文本中的位置进行更新,并将所述滑动窗口增加设定长度,继续根据所述待检测的字符和改变长度后的滑动窗口,对对应的字符串进行判断;
如果否,根据记录的所述待检测的字符对应的字符串在所述文本中的位置,将所述位置后的下一字符作为待检测字符进行判断。
进一步地,所述满足数字规则的字符串包括:
全部为阿拉伯数字的字符串;或
由中文数字和位词构成的字符串。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海信视像科技股份有限公司,未经海信视像科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910449619.3/2.html,转载请声明来源钻瓜专利网。