[发明专利]语音识别方法、装置、计算机设备及存储介质有效
申请号: | 201810548082.1 | 申请日: | 2018-05-31 |
公开(公告)号: | CN108766437B | 公开(公告)日: | 2020-06-23 |
发明(设计)人: | 彭捷 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/04;G10L15/02;G06F16/33;G06F16/903;G06F40/289;G06F40/205;G06F40/232;G06F40/151;G10L15/187 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 谭果林 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 计算机 设备 存储 介质 | ||
1.一种语音识别方法,其特征在于,所述语音识别方法包括:
获取用户根据原文文本输入的语音数据,并使用静音检测算法将所述语音数据切分为语音段;
对每个所述语音段进行识别转换处理,得到转换语句和每个所述转换语句的转换序号,并为每个所述转换语句创建对应的变量存储空间;
对所述原文文本进行预处理,得到标准语句和每个所述标准语句的标准序号;
根据所述标准语句确定切分长度,并按照所述切分长度对每个所述转换语句进行字符串切分,得到待匹配字符串;
针对每个所述待匹配字符串,使用该待匹配字符串与所述标准语句进行匹配,并将匹配成功的标准语句的标准序号,存储到该待匹配字符串所在的转换语句对应的变量存储空间中;
对所述变量存储空间中的标准序号进行分析处理,得到转换错误的语音段和该语音段对应的标准语句;
将所述转换错误的语音段及其对应的标准语句存储到语音库作为数据集,并基于所述数据集对语音识别模型进行训练,以通过训练后的语音识别模型对检测到多音字或与所述转换错误的语音段具有同类型口音的语音数据进行纠错。
2.如权利要求1所述的语音识别方法,其特征在于,所述使用静音检测算法将所述语音数据切分为语音段,包括:
对所述语音数据进行预处理,得到音频数据,其中,所述音频数据包含n个采样点的采样值,n为正整数;
按照预设的帧长和预设的步长对所述音频数据进行分帧处理,得到K帧语音帧,其中,K为正整数;
根据所述采样值计算每帧所述语音帧的帧能量;
针对每帧所述语音帧,若该语音帧的帧能量小于预设的帧能量阈值,则标记该语音帧为静音帧;
若检测到连续的静音帧的数量大于预设的静音帧数量阈值,则标记该连续的静音帧为静音段;
根据所述静音段确定所述语音数据的切分帧,并使用所述切分帧对所述语音数据进行切分,得到所述语音段。
3.如权利要求1所述的语音识别方法,其特征在于,所述对所述原文文本进行预处理,得到标准语句和每个所述标准语句的标准序号,包括:
根据预设的标点符号,对所述原文文本按照语句进行切分,得到切分语句;
对每个所述切分语句进行遍历,若该切分语句包含非中文字符串,则将所述非中文字符串转换为中文,得到所述标准语句,并为每个所述标准语句分配所述标准序号。
4.如权利要求1所述的语音识别方法,其特征在于,所述针对每个所述待匹配字符串,使用该待匹配字符串与所述标准语句进行匹配,并将匹配成功的标准语句的标准序号,存储到该待匹配字符串所在的转换语句对应的变量存储空间中,包括:
将第一句所述标准语句设置为匹配起点,并根据所述匹配起点确定匹配范围;
按照所述转换语句的转换序号的顺序,将每个所述待匹配字符串与所述匹配范围内的标准语句进行匹配,若在所述匹配范围内的标准语句中匹配到与该待匹配字符串一致的内容,则确认匹配成功,否则确认匹配失败;
若匹配成功,则将匹配成功的标准语句的标准序号,存储到该待匹配字符串所在的转换语句对应的变量存储空间中,并以该匹配成功的标准语句作为下一个待匹配字符串的匹配起点;
若匹配失败,则使用下一个待匹配字符串与所述匹配范围内的标准语句进行匹配,直至全部待匹配字符串匹配完为止。
5.如权利要求1所述的语音识别方法,其特征在于,所述对所述变量存储空间中的标准序号进行分析处理,得到转换错误的语音段和该语音段对应的标准语句,包括:
对每个所述变量存储空间中的标准序号进行去重处理,若该变量存储空间中存在至少两个相同的所述标准序号,则保留其中任意一个标准序号,删除其余的标准序号;
若所有的所述变量存储空间中的标准序号之间不连续或者存在重复,则将不连续的标准序号所在的变量存储空间,或者重复的标准序号所在的变量存储空间作为待纠正空间;
若所述变量存储空间为空,则将该变量存储空间及其相邻的两个变量存储空间作为所述待纠正空间;
根据所述待纠正空间及其包含的标准序号,确定转换错误的语音段和该语音段对应的标准语句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810548082.1/1.html,转载请声明来源钻瓜专利网。