[发明专利]基于语音信号的数据处理方法、装置、终端及存储介质在审

申请号：	202010042542.0	申请日：	2020-01-15
公开（公告）号：	CN111462757A	公开（公告）日：	2020-07-28
发明（设计）人：	王秋明;吴富章;邓菁	申请（专利权）人：	北京远鉴信息技术有限公司
主分类号：	G10L17/02	分类号：	G10L17/02;G10L17/06;G10L17/22;G10L15/22;G10L15/02;G10L21/034
代理公司：	北京市京师律师事务所 11665	代理人：	高晓丽
地址：	100000 北京市海淀区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于语音信号数据处理方法装置终端存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种基于语音信号的数据处理方法、装置、终端及存储介质。其中方法包括：检测到语音信号时，确定针对语音信号的多个候选预加重系数各自对应的预加重信号；基于针对语音信号的多个候选预加重系数各自对应的预加重信号，确定多个斜度；将多个斜度分别与预设斜度阈值进行比较，并依据比较结果确定目标斜度以及目标预加重系数；依据目标斜度及目标候选预加重系数，对语音信号进行处理。本申请实施例解决了现有技术中因预加重系数固定导致的因未考虑距离因素导致的语音识别技术中声纹验证精度差、语音识别的准确性低的问题。

技术领域

本申请涉及语音处理技术领域，特别涉及一种基于语音信号的数据处理方法、装置、终端及存储介质。

背景技术

基于语音信号处理的声纹识别、语音识别等交互技术目前在智能家居、智能驾驶等诸多领域都有了比较成熟的应用。语音识别、声纹识别都是基于深度学习等训练方法对海量标注数据进行训练，获得数据分布信息，因此麦克风采集到的音频信号和训练数据的匹配程度会影响后续声纹识别、语音识别的准确率。由于语音信号是宽度信号，能量主要分布在在50Hz到 8000Hz之间。麦克风传感器对各个频率感知增益(频响曲线)并不完全一致，在中高频感知增益低于低频，并且频率越高增益越小。因此，在用户与麦克风的距离适中的情况下，可以调节频响曲线使得采集的声信号在正值与负值之间均衡；在用户与麦克风的距离较近的情况下，音频信号在高频能量分布远远低于低频能量，会造成信号整体下移，影响后续声纹识别、语音识别的准确性。

相关技术中一般采用号预加重技术对不同频带的能量进行调整，但预加重技术中采用的是通过固定的前向滤波权重的方式，来抑制低频能量并实现能量均衡，因此，这种方式并无法解决距离对不同频带的能量的影响，存在声纹验证精度差、语音识别的准确性低的问题。

发明内容

本申请旨在解决至少一个上述技术问题，本申请提出一种基于语音信号的数据处理方法、装置、终端及存储介质。

第一方面，本申请提供一种基于语音信号的数据处理方法，该方法包括：

检测到语音信号时，确定针对语音信号的多个候选预加重系数各自对应的预加重信号；

基于针对语音信号的多个候选预加重系数各自对应的预加重信号，确定多个斜度；

将多个斜度分别与预设斜度阈值进行比较，并依据比较结果确定目标斜度以及目标预加重系数；

依据目标斜度及目标候选预加重系数，对语音信号进行处理。

第二方面，本申请提供一种基于语音信号的数据处理装置，该装置包括：

加重信号确定模块，用于检测到语音信号时，确定针对语音信号的多个候选预加重系数各自对应的预加重信号；

信号斜度确定模块，用于基于针对语音信号的多个候选预加重系数各自对应的预加重信号，确定多个斜度；

处理参数确定模块，用于将多个斜度分别与预设斜度阈值进行比较，并依据比较结果确定目标斜度以及目标预加重系数；