[发明专利]语音识别方法、装置、计算机设备和存储介质有效

专利信息
申请号: 201711349803.8 申请日: 2017-12-15
公开(公告)号: CN108022587B 公开(公告)日: 2021-03-05
发明(设计)人: 张伟彬 申请(专利权)人: 深圳市声扬科技有限公司
主分类号: G10L15/16 分类号: G10L15/16;G10L15/04;G10L15/02;G10L25/21;G10L25/87
代理公司: 广州华进联合专利商标代理有限公司 44224 代理人: 谢曲曲
地址: 518000 广东省深圳市*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 识别 方法 装置 计算机 设备 存储 介质
【说明书】:

本申请涉及一种语言识别方法、装置、计算机设备和存储介质,上述方法通过从带下采样的延时神经网络的网络层中获取目标网络层;对所述目标网络层添加第二神经网络,将所述目标网络层的输出数据作为所述第二神经网络的输入数据,所述第二神经网络包括至少一层网络;获取待识别语音数据,将所述待识别语音数据输入所述带下采样的延时神经网络中,通过所述带下采样的延时神经网络和所述第二神经网络对所述待识别语音进行识别,得到对应的语音识别结果。通过将带下采样的延时神经网络和第二神经网络共同对语音数据进行识别得到更好语音识别结果。

技术领域

本申请涉及音频处理技术领域,特别是涉及一种语音识别方法、装置、计算机设备和存储介质。

背景技术

语音识别技术,广泛来说是指语意识别和声纹识别;从狭义上来说指语音语义的理解识别,也称为自动语音识别。语音识别技术是一种利用计算机将数字语音识别成文字的技术,近年来,语音识别技术取得了很大的进步,在很多领域有广泛的应用。

完整的语音识别系统包括语音采样模块、特征提取模块和识别模块。特征提取模块是将输入的数字语音信号转换成识别系统用到的声学特征,语音识别器利用声学模型、词典以及语音模型,根据输入的声学特征,搜索出最佳的识别结果。声学模型作为整个识别系统最为核心的部分,故声学模型的好坏影响整个语音识别系统的性能。现代语音识别系统中,基本都是采用隐马尔科夫模型—深度神经网络作为声学模型,通过该声学模型进行语音识别依旧存在识别率低下的问题。

发明内容

基于此,有必要针对上述技术问题,提供一种提升语音识别率的语音识别方法、装置、计算机设备和存储介质。

一种语音识别方法,包括:从带下采样的延时神经网络的网络层中获取目标网络层;对所述目标网络层添加第二神经网络,将所述目标网络层的输出数据作为所述第二神经网络的输入数据,所述第二神经网络包括至少一层网络;获取待识别语音数据,将所述待识别语音数据输入所述带下采样的延时神经网络中,通过所述带下采样的延时神经网络和所述第二神经网络对所述待识别语音进行识别,得到对应的语音识别结果。

在其中一个实施例中,对所述目标网络层添加第二神经网络的步骤,包括:

当所述第二神经网络为一层神经网络时,将所述目标网络层的中的每一个神经元与所述第二神经网络中的每一个神经元进行连接;或当所述第二神经网络为多层神经网络时,将所述目标网络层的中的每一个神经元与所述第二神经网络中的第一层网络的每一个神经元进行连接,所述第二神经网络中相邻两层网络中下一层网络的每一个神经元与上一层网络的每一个神经元进行连接。

在其中一个实施例中,所述待识别语音数据为多个语音帧组成,获取待识别语音数据的步骤,包括:获取原始待识别语音数据;对所述原始待识别语音数据进行预加重;将预加重后的所述原始待识别语音数据进行加窗分帧处理,对加窗分帧之后的所述原始待识别语音数据进行变换得到多个语音帧组成的所述待识别语音数据。

在其中一个实施例中,对加窗分帧之后的所述原始待识别语音数据进行变换得到多个语音帧组成的所述待识别语音数据的步骤之后,还包括:对所述待识别语音进行端点检测,进行端点检测的步骤包括:计算变换后的每帧语音的能量值;当检测到当前帧之前的连续多帧语音的能量值低于预设能量阈值,且当前帧后续多帧语音的能量值高于预设能量阈值,则所述能量值增大的位置为语音的起始端点;当检测到当前帧前的后续连续多帧语音的能量值低于预设能量阈值,且当前帧之前的连续多帧语音的能量值高于预设能量阈值,则所述能量值减小的位置为语音的结束端点。

在其中一个实施例中,所述目标层网络与添加在所述目标层网络中的所述第二神经网络,在所述目标层中实现参数共享,所述参数共享为对于不同时间的输入信号,都采用相同的网络参数进行处理。

一种语音识别装置,包括:

目标网络层获取模块,用于从带下采样的延时神经网络的网络层中获取目标网络层;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市声扬科技有限公司,未经深圳市声扬科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711349803.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top