[发明专利]基于混合噪声场景下的精度可控语音端点判别技术在审

专利信息
申请号: 201910746373.6 申请日: 2019-08-14
公开(公告)号: CN112447190A 公开(公告)日: 2021-03-05
发明(设计)人: 王镇;刘波;朱文涛;于华振;范虎;郭世晟 申请(专利权)人: 南京约顿海姆电子科技有限公司
主分类号: G10L25/84 分类号: G10L25/84;G10L25/78;G10L15/16;G10L15/04;G06N3/08;G06N3/04
代理公司: 暂无信息 代理人: 暂无信息
地址: 210000 江苏省南京市江北新*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 混合 噪声 场景 精度 可控 语音 端点 判别 技术
【权利要求书】:

1.如权利要求1所述的基于混合噪声场景下的精度可控语音端点判别技术,其特征在于:包括语音信号采集模块、优化设计特征提取模块、神经网络运算模块;增设底噪声检测模块、可配置N比特数据量化模块(其中N=8,4,2,1)、神经网络参数预处理模块;所述语音信号采集模块由语音麦克风采集电路和一个低噪声放大电路构成,语音麦克风采集电路输出结果一方面送入底噪声检测模块,另一方面经过低噪声放大电路送入特征提取模块;所述优化设计特征提取模块由26个矩形数字滤波器构成,采样频率为16KHZ,工作时对连续的语音信号进行滤波处理,输出结果的经过对数运算最终的语音信号特征。与传统梅尔滤波器(MFCC)特征提取方式相比,矩形滤波器具有更快的运算速度、更低的功耗以及可比拟的运算精度;所述神经网络运算模块、增设底噪声检测模块、可配置N比特数据量化模块(其中N=8,4,2,1)、神经网络参数预处理模块用于实时运算得出带噪声语音的分类阈值信息,上述模块其输入为M帧语音特征信息(M为1,3,6),其输出Z为[0,1]之间唯一确定值,对于输出Z大于0.7的输入语音帧,则判别当前输入语音帧为有用的语音信息,否则则输出无用的噪声信息;基于混合噪声场景下的精度可控语音端点判别技术各模块之间协同配合,根据当前外界场景噪声大小,动态调整神经网络参数预处理模块的工作模式,并在精度可控范围内,更改了前项语音特征提取的滤波器结构,实时对网络运算参数的量化处理,大大减少了乘法硬件单元结构,在最优情况下仅仅需要加法单元进行运算操作。

2.如权利要求1所述的基于混合噪声场景下的精度可控语音端点判别技术,其特征在于:所述底噪声检测模块由底噪声检测电路和阈值比较电路构成;低噪检测电路获取当前采集的语音信号底噪声大小,并计算得出当前语音信噪比大小;当前语音信噪比通过阈值比较电路动态输出当前语音环境下量化位数选取结果。

3.如权利要求1所述的基于混合噪声场景下的精度可控语音端点判别技术,其特征在于:所述可重构K值化神经网络模块由输入层、4个全连接(FC)网络层、可配置N比特数据量化模块、分类层、输出层构成;在电路正常工作时,可配置N比特数据量化模块可根据底噪声模块的输出结果,动态可配置的对网络层数据进行N比特量化,同时并行读取神经网络参数预处理模块的参数输出结果;分类层依据核心网络层输出概率结果判断并输出最终当前语音是否包含有用的声音信息。

4.如权利要求1所述的基于混合噪声场景下的精度可控语音端点判别技术,其特征在于:所述的神经网络参数预处理模块由一个网络参数存储模块以及自适应模式切换模块,具有两种工作模式,即一般模式和高精度模式;该模块可根据电路前端判别的当前环境语音信噪比大小自适应进行工作模式选择,在一般模式下,从存储模块中动态输出二值化(-1或1)的权重、偏置等网络参数;在高精度模式下,则输出2比特权重、偏置等网络参数以满足精度需求。

5.如权利要求1所述的基于混合噪声场景下的精度可控语音端点判别技术,其特征在于:可配置N比特数据量化模块由归一化模块和量化模块构成,可根据前项底噪声检测模块输出的控制信息,动态实现对网路层输出数据参数进行N比特数据量化,其中归一化模块由单元、数据筛选单元、一个二位乘法器构成;单元将输入的数据转换归一到(-1,1)之间,数据筛选单元输出由单元输出的批量值中的绝对值中最大值的倒数,二位乘法器将上述两者输出做乘法运算输出[-1,1]的批量数据;可配置的N位比较器单元(其中N=8、4、2、1),可根据归一化模块输出结果,以及底噪声检测模块输出的控制信息,可配置的N位比较器单元输出结果对应当前数据量化结果。

6.基于混合噪声场景下的精度可控语音端点判别技术,其整个功能的实现流程:步骤1:通过给定的语音信号采集模块采集当前语音时序信号;步骤2 :利用优化设计特征提取模块,获取语音的特征数据,底噪声检测模块与特征提取模块协同工作,对采集的语音时域信号,检测其底噪声大小同时输出模式控制信息和网络层数据量化控制信息,完成神经网络模块参数设置步骤3:可配置的神经网络模块依据底噪声检测模块给定的控制信息动态读取神经网络参数预处理模块的权重、偏置参数,判定各层数据量化位数最最优结果,并通过神经网络运算模块对进行对语音特征信息进行先验运算;步骤4:通过对网络层输出结果的与预先设定评判规则进行评判,最终输出当前语音的端点检测结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京约顿海姆电子科技有限公司,未经南京约顿海姆电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910746373.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top