[发明专利]基于语音信号的数据处理方法、装置、终端及存储介质在审
申请号: | 202010042542.0 | 申请日: | 2020-01-15 |
公开(公告)号: | CN111462757A | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 王秋明;吴富章;邓菁 | 申请(专利权)人: | 北京远鉴信息技术有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/06;G10L17/22;G10L15/22;G10L15/02;G10L21/034 |
代理公司: | 北京市京师律师事务所 11665 | 代理人: | 高晓丽 |
地址: | 100000 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语音 信号 数据处理 方法 装置 终端 存储 介质 | ||
本申请公开了一种基于语音信号的数据处理方法、装置、终端及存储介质。其中方法包括:检测到语音信号时,确定针对语音信号的多个候选预加重系数各自对应的预加重信号;基于针对语音信号的多个候选预加重系数各自对应的预加重信号,确定多个斜度;将多个斜度分别与预设斜度阈值进行比较,并依据比较结果确定目标斜度以及目标预加重系数;依据目标斜度及目标候选预加重系数,对语音信号进行处理。本申请实施例解决了现有技术中因预加重系数固定导致的因未考虑距离因素导致的语音识别技术中声纹验证精度差、语音识别的准确性低的问题。
技术领域
本申请涉及语音处理技术领域,特别涉及一种基于语音信号的数据处 理方法、装置、终端及存储介质。
背景技术
基于语音信号处理的声纹识别、语音识别等交互技术目前在智能家居、 智能驾驶等诸多领域都有了比较成熟的应用。语音识别、声纹识别都是基 于深度学习等训练方法对海量标注数据进行训练,获得数据分布信息,因 此麦克风采集到的音频信号和训练数据的匹配程度会影响后续声纹识别、 语音识别的准确率。由于语音信号是宽度信号,能量主要分布在在50Hz到 8000Hz之间。麦克风传感器对各个频率感知增益(频响曲线)并不完全一致,在中高频感知增益低于低频,并且频率越高增益越小。因此,在用户 与麦克风的距离适中的情况下,可以调节频响曲线使得采集的声信号在正 值与负值之间均衡;在用户与麦克风的距离较近的情况下,音频信号在高 频能量分布远远低于低频能量,会造成信号整体下移,影响后续声纹识别、 语音识别的准确性。
相关技术中一般采用号预加重技术对不同频带的能量进行调整,但预 加重技术中采用的是通过固定的前向滤波权重的方式,来抑制低频能量并 实现能量均衡,因此,这种方式并无法解决距离对不同频带的能量的影响, 存在声纹验证精度差、语音识别的准确性低的问题。
发明内容
本申请旨在解决至少一个上述技术问题,本申请提出一种基于语音信 号的数据处理方法、装置、终端及存储介质。
第一方面,本申请提供一种基于语音信号的数据处理方法,该方法包括:
检测到语音信号时,确定针对语音信号的多个候选预加重系数各自对应的 预加重信号;
基于针对语音信号的多个候选预加重系数各自对应的预加重信号,确定多 个斜度;
将多个斜度分别与预设斜度阈值进行比较,并依据比较结果确定目标斜度 以及目标预加重系数;
依据目标斜度及目标候选预加重系数,对语音信号进行处理。
第二方面,本申请提供一种基于语音信号的数据处理装置,该装置包括:
加重信号确定模块,用于检测到语音信号时,确定针对语音信号的多个候 选预加重系数各自对应的预加重信号;
信号斜度确定模块,用于基于针对语音信号的多个候选预加重系数各自对 应的预加重信号,确定多个斜度;
处理参数确定模块,用于将多个斜度分别与预设斜度阈值进行比较,并依 据比较结果确定目标斜度以及目标预加重系数;
信号处理模块,用于依据目标斜度及目标候选预加重系数,对语音信号进 行处理。
第三方面,本申请提供一种终端,该终端包括:
存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处 理器执行计算机程序时实现上述基于语音信号的数据处理方法。
第四方面,本申请提供一种计算机可读存储介质,存储有计算机可执行 指令,计算机可执行指令用于执行上述基于语音信号的数据处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京远鉴信息技术有限公司,未经北京远鉴信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010042542.0/2.html,转载请声明来源钻瓜专利网。