[发明专利]一种基于BP神经网络的本地语音识别方法无效
申请号: | 201310430537.7 | 申请日: | 2013-09-18 |
公开(公告)号: | CN103514879A | 公开(公告)日: | 2014-01-15 |
发明(设计)人: | 孙建华 | 申请(专利权)人: | 广东欧珀移动通信有限公司 |
主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L15/06 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李盛洪 |
地址: | 523860 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 bp 神经网络 本地 语音 识别 方法 | ||
1.一种基于BP神经网络的本地语音识别方法,其特征在于,具体步骤如下:
(1)用户针对系统中的各操作,分别在系统中输入相应的语音,通过系统建立操作和语音的命令集映射对,作为BP神经网络的原始训练集,对BP神经网络进行训练,所述语音为用户输入的原始语音信息,系统对其进行预处理及特征参数提取,将提取的特征参数值输入到BP神经网络的输入端,所述操作为系统执行的应用程序,所述操作对应的应用程序包名为BP神经网络的输出;
(2)BP神经网络的训练完后,用户向系统输入语音数据,系统首先对用户输入的语音数据进行预处理及提取语音的特征参数值,语音的特征参数值经过BP神经网络进行传播,将神经网络实际输出值与所有的期望值进行比较;
若有其中一个误差值小于预先设定的误差值,则将该误差对应的输出作为语音识别的最终输出;然后进入步骤(3);
若所有的误差值均大于预先设定的误差值,则进入步骤(4);
(3)系统识别BP神经网络输出的应用程序的包名,调用包名相应的应用程序,执行应用程序相应的操作;
(4)将所有的误差值在BP神经网络中反向传播,作为BP神经网络的输入,从而修正各个节点单元的权值;
若当前学习次数小于预先设定的学习次数,则继续传播,直到其中一个误差值小于预先设定的误差值为止;
若当前学习次数大于预先设定的学习次数时,还未出现一个误差值小于预先设定的误差值,则结束训练,并且由系统作出无法找到应用程序的提示。
2.根据权利要求1所述的基于BP神经网络的本地语音识别方法,其特征在于,所述步骤(1)中,操作和语音命令集映射对中操作的应用程序包名存放在系统的ArrayList中;ArrayList中包名的个数和BP神经网络输出层的输出维数相同。
3.根据权利要求1所述的基于BP神经网络的本地语音识别方法,其特征在于,所述步骤(1)和步骤(2)中语音的特征参数值的个数为6,所述BP神经网络的输入层的输入维数和语音的特征参数值的个数相同;所述语音的特征参数为能量、幅度、过零率、频谱、倒谱和功率谱。
4.根据权利要求1所述的基于BP神经网络的本地语音识别方法,其特征在于,所述步骤(1)和步骤(2)中语音的预处理包括对语音依次进行预加重、加窗分帧和端点检测处理。
5.根据权利要求1所述的基于BP神经网络的本地语音识别方法,其特征在于,所述操作和语音的命令集映射对中,包含有多个语音映射同一个操作的情况。
6.根据权利要求1所述的基于BP神经网络的本地语音识别方法,其特征在于,所述步骤(2)中,预先设定的误差值为0.000001。
7.根据权利要求1所述的基于BP神经网络的本地语音识别方法,其特征在于,所述步骤(3)中预先设定的学习次数为1000。
8.根据权利要求1所述的基于BP神经网络的本地语音识别方法,其特征在于,系统在建立操作和语音的命令集映射对过程中,用户根据操作的作用输入相应的语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东欧珀移动通信有限公司,未经广东欧珀移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310430537.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:高效去除复合不锈钢管焊缝余高的装置
- 下一篇:具有多层油漆涂层的电子汽车衡