[发明专利]一种智能语音识别开关面板在审
申请号: | 201911045265.2 | 申请日: | 2019-10-30 |
公开(公告)号: | CN110855281A | 公开(公告)日: | 2020-02-28 |
发明(设计)人: | 周坤 | 申请(专利权)人: | 重庆瑞坤科技发展股份有限公司 |
主分类号: | H03K17/94 | 分类号: | H03K17/94;G08C23/02;G10L15/22 |
代理公司: | 重庆启恒腾元专利代理事务所(普通合伙) 50232 | 代理人: | 黎志红 |
地址: | 401120 重庆市渝北区*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 语音 识别 开关 面板 | ||
1.一种智能语音识别开关面板,其特征在于,包括:电源模块、语音识别模块、按键和LED灯指示模块、通讯模块、存储模块和处理器模块,电源由市电110-220VAC提供,并由开关电源降压到12V和线性降压到3.3V和5V给整个智能语音识别开关面板提供稳定电源;处理器模块用于处理语音识别模块、通讯模块数据交换和按键指示模块的协调;语音识别模块是智能识别面板所对应功能的语音,由处理器模块处理语音相对应的动作,用于对人耳听觉系统的语音信号进行处理识别;通讯模块是与整个系统之间通信来实现远程控制的桥梁,存储模块用于存储处理器模块的信息,LED灯指示语音识别和开关状态;
所述语音识别模块又包括噪声获取模块、语音分离模块、目标语音信号获取模块、预处理模块,噪声获取模块用于采用模拟人耳听觉系统获取含噪声的语音信号;语音分离模块用于对得到的含噪声的语音信号,采用基于人耳听觉特性的语音分离方法进行语音分离;目标语音信号获取模块用于采用语音定位获取目标语音信号;预处理模块用于对获取的目标语音信号再进行其他预处理,其他预处理包括预加重、分帧加窗、双门限端点检测、听觉掩蔽谱减法进行处理,所述双门限端点检测主要是改变短时过零率的阈值,不再寻找过零率大于某一个阈值,而是小于某一阈值完成语音识别;
听觉掩蔽谱减法具体为:在计算听觉掩蔽值之前,首先求得临界带宽的功率谱、扩展临界带宽的功率谱以及噪声掩蔽扩展门限,然后把噪声掩蔽扩展门限与人耳听觉的设定绝对门限值进行对比,听觉掩蔽阈值就是它们之中的最大值。
2.根据权利要求1所述的一种智能语音识别开关面板,其特征在于,所述电源模块由市电110-220VAC提供,并由开关电源降压到12V和线性降压到3.3V和5V给整个智能语音开关面板提供稳定电源;处理器模块采用Microchip的PIC24内核16位先进的低功耗芯片;按键和LED灯指示模块用于面板开关操作、语音识别和开关状态指示;存储模块用于存储语音识别离线版本的数据,和存储开关状态。
3.根据权利要求1所述的一种智能语音识别开关面板,其特征在于,所述语音分离模块采用基于人耳听觉特性的语音分离方法进行语音分离具体包括:2-1)经过耳蜗基底膜模型进行频谱分析;选择具有人耳听觉特性的Gammatone滤波器组对语音信号进行频率分解;所述Gammatone滤波器组频率的选择范围从20Hz-4KHz分别对左、右耳混叠信号按时间帧进行频率分解;耳蜗基底膜模型将语音信号按照滤波器个数进行传递;2-2)再通过上橄榄核模型进行语音信息提取;2-3)最后在下丘脑细胞模型中完成语音分离。
4.根据权利要求3所述的基于人耳听觉特性的语音识别预处理方法,其特征在于,所述步骤2-2)通过上橄榄核模型进行语音信息提取具体为;
耳蜗基底膜处理语音信号后分成多个通道传递给上橄榄复合体进行语音信号的双耳时间差ITD和双耳水平差ILD定位信息的提取,ITD的计算公式如下:
式中:
——左耳和右耳的语音信号的互相关,可由下式计算:
式中:
——左耳和右耳语音信号互功率谱
ILD的计算公式如下:
式中:
——左耳和右耳的ILD值;Ωi——子带i的频率范围(1KHz~4KHz)Wi(ω)——滤波器权重;S(ω)——声源功率谱。
5.根据权利要求4所述的基于人耳听觉特性的语音识别预处理方法,其特征在于,当信号为20Hz到1000Hz低频语音信号时,重合神经元模型只有来自上橄榄内侧的语音特征输入;1000Hz到4KHz语音信号时,上橄榄外侧和上橄榄内侧的语音特征都输入重合神经元;高于4KHz语音信号时,重合神经元只有上橄榄外侧语音特征的输入。
6.根据权利要求5所述的基于人耳听觉特性的语音识别预处理方法,其特征在于,所述临界带宽的表达式如下:
Z=26.18f/(1960+f)-0.53
其中,Z表示临界带宽编号,f表示频率;
所述扩展临界带宽的功率谱在式中,P(k)为信号快速傅里叶变换的功率谱,li和hi分别表示第i个临界带宽的最小频率和最大频率,i在[1,imax]的范围内,并且语音信号的采样频率决定imax;
计算出噪声掩蔽阈值后,利用噪声掩蔽阈值和自适应的谱减法系数,得到两个谱减法系数,再结合Berouti提出的改进谱减法的方法,得到听觉掩蔽谱减法表达式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆瑞坤科技发展股份有限公司,未经重庆瑞坤科技发展股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911045265.2/1.html,转载请声明来源钻瓜专利网。