[发明专利]一种基于BP神经网络的本地语音识别方法无效
申请号: | 201310430537.7 | 申请日: | 2013-09-18 |
公开(公告)号: | CN103514879A | 公开(公告)日: | 2014-01-15 |
发明(设计)人: | 孙建华 | 申请(专利权)人: | 广东欧珀移动通信有限公司 |
主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L15/06 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李盛洪 |
地址: | 523860 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 bp 神经网络 本地 语音 识别 方法 | ||
技术领域
本发明涉及一种语音识别方法,特别涉及一种基于BP神经网络的本地语音识别方法。
背景技术
语音识别是机器通过识别和理解过程把人类的语音信号转变成相应的文本或命令的技术,其根本目的是研究出一种具有听觉功能的机器,这种机器能直接接受人的语音,理解人的意图,并做出相应的反应。语音识别作为人机交互的一项关键领域,具备了实时,方便,快速等特点,在当今科学技术的发展上也有着日益重要的地位。
其中人工神经网络在语音识别中的应用已经成为目前语音识别的主流方法;但是现有终端的语音识别都是将设定好的数据库作为神经网络的原始训练集,在训练集中预设定的是一些比较规范的“参考语音”,在识别过程中,将用户的语音与规范的“参考语音”进行比较,由于每个人说同一句话的语音、语速等不同,因此原始训练集中必须要存放更多的训练样本,识别速度慢、精度低,而且需要大存储量的数据库进行原始训练集的存放。
另外,现有终端的语音识别基本通过以下两种方式实现:一、数据库存放在网络端,这种情况下,当没有网络时,将直接无法使用语音识别方法。二、数据库存在本地,当要求终端能够识别多种语言和方言时,势必会造成数据库存储容量需求过大。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供一种数据库存储量需求少、语音识别速度快及精度高的基于BP神经网络的本地语音识别方法。
本发明的目的通过下述技术方案实现:一种基于BP神经网络的本地语音识别方法,具体步骤如下:
(1)用户针对系统中的各操作,分别在系统中输入相应的语音,通过系统建立操作和语音的命令集映射对,作为BP神经网络的原始训练集,对BP神经网络进行训练,所述语音为用户输入的原始语音信息,系统对其进行预处理及特征参数提取,将提取的特征参数值输入到BP神经网络的输入端,所述操作为系统执行的应用程序,所述操作对应的应用程序包名为BP神经网络的输出;
(2)BP神经网络的训练完后,用户向系统输入语音数据,系统首先对用户输入的语音数据进行预处理及提取语音的特征参数值,语音的特征参数值经过BP神经网络进行传播,将神经网络实际输出值与所有的期望值进行比较;
若有其中一个误差值小于预先设定的误差值,则将该误差对应的输出作为语音识别的最终输出;然后进入步骤(3);
若所有的误差值均大于预先设定的误差值,则进入步骤(4);
(3)系统识别BP神经网络输出的应用程序的包名,调用包名相应的应用程序,执行应用程序相应的操作;
(4)将所有的误差值在BP神经网络中反向传播,作为BP神经网络的输入,从而修正各个节点单元的权值;
若当前学习次数小于预先设定的学习次数,则继续传播,直到其中一个误差值小于预先设定的误差值为止;
若当前学习次数大于预先设定的学习次数时,还未出现一个误差值小于预先设定的误差值,则结束训练,并且由系统作出无法找到应用程序的提示。
优选的,所述步骤(1)中,操作和语音命令集映射对中操作的应用程序包名存放在系统的ArrayList中;ArrayList中包名的个数和BP神经网络输出层的输出维数相同。
优选的,所述步骤(1)和步骤(2)中语音的特征参数值的个数为6,所述BP神经网络的输入层的输入维数和语音的特征参数值的个数相同;所述语音的特征参数为能量、幅度、过零率、频谱、倒谱和功率谱。
优选的,所述步骤(1)和步骤(2)中语音的预处理包括对语音依次进行预加重、加窗分帧和端点检测处理。
优选的,所述操作和语音的命令集映射对中,包含有多个语音映射同一个操作的情况。
优选的,所述步骤(2)中,预先设定的误差值为0.000001。
优选的,所述步骤(3)中预先设定的学习次数为1000。
优选的,系统在建立操作和语音的命令集映射对过程中,用户根据操作的作用输入相应的语音。
本发明相对于现有技术具有如下的优点及效果:
(1)本发明中根据用户自身建立的操作和语音命令集映射对实现BP神经网络的训练,本发明中通过终端系统本地的操作和语音命令集映射对代替传统语音识别方法中数据库中的训练数据,在极大程度上节省了终端的训练集存储容量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东欧珀移动通信有限公司,未经广东欧珀移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310430537.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:高效去除复合不锈钢管焊缝余高的装置
- 下一篇:具有多层油漆涂层的电子汽车衡