[发明专利]一种双层PID优化的BP神经网络语音识别方法有效
| 申请号: | 202011455918.7 | 申请日: | 2020-12-10 |
| 公开(公告)号: | CN112542161B | 公开(公告)日: | 2022-08-12 |
| 发明(设计)人: | 和思铭;李伟觐;曾文钰;范晨奥;刘世新;汪雨琦;吴英然 | 申请(专利权)人: | 长春工程学院 |
| 主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L15/06;G06N3/08;G06N3/04 |
| 代理公司: | 长春吉大专利代理有限责任公司 22201 | 代理人: | 王立文 |
| 地址: | 130012 吉林*** | 国省代码: | 吉林;22 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 双层 pid 优化 bp 神经网络 语音 识别 方法 | ||
1.一种双层PID优化的BP神经网络语音识别方法,其特征在于:
首先,搭建三层BP神经网络,分别为输入层、隐藏层和输出层,随机生成输出层和隐藏层之间的加权系数Wij(k)和Wjg(k),以及两层间激活函数参数aj(k)和bg(k),选取学习率η(k),并令k=1;
其次,FPGA平台对需要识别的语音进行语音数据提取,并使用BP神经网络对提取后的数据Xi(k)进行分析,计算BP神经网络输出层的输出Og(k),同时根据期望输出Yg(k)计算误差Eg(k),使用误差Eg(k)与比例参数KP,积分参数KI,微分参数KD对η(k)进行PID调节;
学习速率更新后,再将更新后的学习速率η(k)以及输出误差Eg(k)作为内层PID更新公式中的参数,之后对输入层与隐藏层之间权值、隐藏层阈值、隐藏层与输出层之间权值和输出层阈值进行更新,直到BP神经网络输出层输出误差满足要求为止,最后对输入的语音进行判定,是否为设定的语音信号;
包括以下步骤:
A、进行训练初始化准备,将神经网络结构初始化,获取训练用的样本集;
B、对样本集进行特征提取,得到特征集;
C、以特征集作为训练集对神经网络进行训练,在训练过程中使用期望输出Yg(k)与实际输出Og(k)得到误差Eg(k),误差Eg(k)作为外层PID算法中的参数对学习速率η(k)进行调节,之后继续使用误差Eg(k)与调节后的学习速率η(k+1)作为内层PID算法参数对输入层的权值Wij(k)、阈值aj(k),以及输出层权值Wjg(k)、阈值bg(k)进行调节;
D、对调节后的神经网络进行测试,测试样本按照步骤(2)进行特征提取,之后交由经过步骤的(3)神经网络进行识别,得到步骤(3)所述误差Eg(k),当误差Eg(k)小于一定阈值,神经网络训练完成,判断输入的语音信号是否为设定的语音信号。
2.根据权利要求1所述的一种双层PID优化的BP神经网络语音识别方法,其特征在于,所述步骤C中,误差Eg(k)作为外层PID算法参数对学习速率进行调节,外层PID调节公式如下:
其中s=1,2,…,k,k为当前迭代次数,N3为输出层层数,取N3=3,其中
EgD(k)=Eg(k)-Eg(k-1)。
3.根据权利要求1所述的一种双层PID优化的BP神经网络语音识别方法,其特征在于,所述步骤C中,使用误差Eg(k)与调节后的学习速率η(k+1)作为内层PID算法参数对输入层与隐藏层之间权值Wij(k),隐藏层阈值aj(k),以及隐藏层与输出层之间权值Wjg(k),输出层阈值bg(k)进行调节,外层PID调节公式如下,
输入层与隐藏层之间权值的更新公式为:
隐藏层阈值的公式为:
N3为输出层层数,取N3=3,
隐藏层与输出层之间权值的更新公式为:
输出层阈值的更新公式为:
其中s=1,2,…,k,k为当前迭代次数,N3为输出层层数,取N3=3,其中EgD(k)=Eg(k)-Eg(k-1)。
EgD(k)=Eg(k)-Eg(k-1)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长春工程学院,未经长春工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011455918.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:链式退火装置及管材处理工艺
- 下一篇:一种在线快速供布接布装置及方法





