[发明专利]一种语音识别的方法及装置在审
| 申请号: | 201910807084.2 | 申请日: | 2019-08-29 |
| 公开(公告)号: | CN110619879A | 公开(公告)日: | 2019-12-27 |
| 发明(设计)人: | 余文胜;何建文;叶和兴;李轩 | 申请(专利权)人: | 深圳市梦网科技发展有限公司 |
| 主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/22;G06F16/242 |
| 代理公司: | 44414 深圳中一联合知识产权代理有限公司 | 代理人: | 汪霞 |
| 地址: | 518000 广东省深圳市南山区高新中*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 拼音 文字内容 检索 语音识别技术 预存 数据库 语音识别结果 二次检索 输出结果 语音识别 识别率 注音 申请 删除 替换 汉字 语音 | ||
本申请适用于语音识别技术领域,提供了一种语音识别的方法及装置,包括:获取待识别语音对应的第一文字内容;将所述第一文字内容进行注音得到第一拼音,根据所述第一拼音在预存数据库中进行检索;当检索到第一相同内容时,则将所述第一文字内容作为输出结果;当未检索到第一相同内容时,则将所述第一拼音中易混拼音进行替换得到第二拼音或将所述第一拼音首位或末位汉字的拼音删除得到第三拼音,根据所述第二拼音或第三拼音在预存数据库中进行检索。本申请通过上述方式实现对语音识别结果进行二次检索处理,提高了语音识别技术的识别率。
技术领域
本申请属于语音识别技术领域,尤其涉及一种语音识别的方法及装置、计算机可读存储介质。
背景技术
语音识别技术,也被称为自动语音识别(Automatic Speech Recognition,ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。然而由于语音识别结果的准确性受限于多种因素影响,比如每个人的发音口音、环境噪音等,因此针对语音识别结果的纠错与匹配是一项重要研究方向。目前语音识别技术针对语音识别结果的准确性改善的技术主攻方向是对识别的算法进行技术升级,达到更高的识别能力,而通过算法进行识别率提高的空间有限,导致现有的语音识别技术的识别率依然偏低。
发明内容
有鉴于此,本申请实施例提供了一种语音识别的方法及装置,可以解决通过算法提升语音识别率偏低的技术问题。
本申请实施例的第一方面提供了一种语音识别的方法,包括:
获取待识别语音对应的第一文字内容;
将所述第一文字内容进行注音得到第一拼音,根据所述第一拼音在预存数据库中进行检索;
当检索到第一相同内容时,则将所述第一文字内容作为输出结果;
当未检索到第一相同内容时,则将所述第一拼音中易混拼音进行替换得到第二拼音,或将所述第一拼音首位或末位汉字的拼音删除得到第三拼音,根据所述第二拼音或第三拼音在预存数据库中进行检索,所述易混拼音包括平翘舌声母,和/或前后鼻音韵母;
当根据所述第二拼音或所述第三拼音检索得到第二相同内容,则将所述第二相同内容作为输出结果;
当根据所述第二拼音和/或所述第三拼音未检索得到第二相同内容,则将所述第一文字内容作为输出结果。
本申请实施例的第二方面提供了一种语音识别的装置,包括:
获取单元,用于获取待识别语音对应的第一文字内容;
检索单元,用于将所述第一文字内容进行注音得到第一拼音,根据所述第一拼音在预存数据库中进行检索;当检索到第一相同内容时,则将所述第一文字内容作为输出结果;当未检索到第一相同内容时,则将所述第一拼音中易混拼音进行替换得到第二拼音,或将所述第一拼音首位或末位汉字的拼音删除得到第三拼音,根据所述第二拼音或第三拼音在预存数据库中进行检索,所述易混拼音包括平翘舌声母,和/或前后鼻音韵母;当根据所述第二拼音或所述第三拼音检索得到第二相同内容,则将所述第二相同内容作为输出结果;当根据所述第二拼音和/或所述第三拼音未检索得到第二相同内容,则将所述第一文字内容作为输出结果。
本申请实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述方法的步骤。
本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市梦网科技发展有限公司,未经深圳市梦网科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910807084.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于办公系统的语音交互方法和装置
- 下一篇:一种声纹处理系统及用户识别方法





