[发明专利]一种基于多尺度非线性能量算子的语音信号周期分割方法有效
申请号: | 201810640530.0 | 申请日: | 2018-06-21 |
公开(公告)号: | CN108830232B | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 朱成华;卢光明;武克斌;张大鹏;钟德才 | 申请(专利权)人: | 浙江中点人工智能科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 广州海藻专利代理事务所(普通合伙) 44386 | 代理人: | 王敏 |
地址: | 325025 浙江省温州市龙湾区*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 尺度 非线性 能量 算子 语音 信号 周期 分割 方法 | ||
1.一种基于多尺度非线性能量算子的语音信号周期分割方法,其特征在于,包括以下步骤:
S1、多尺度非线性能量算子TKEO表示为:
Ψ[x(n)]=x(n)2-x(n-1)x(n+1)
其中x(n)为离散语音信号,n代表采样点;
S2、定义绝对TKEO算子aTKEO(absoluteTKEO):
|Ψ[x(n)]|=|x(n)2-x(n-1)x(n+1)|
S3、将aTKEO扩展至带尺度参数L的算子RaTKEO,定义如下:
|ΨL[x(n)]|=|x(n)2-x(n-L)x(n+L)|
其中,参数L为正整数;
S4、分别采用最大值融合、乘积融合和均值融合三种融合策略得到以下三个融合值:
其中,M为尺度数,k为尺度,p1(n)表示采用最大值融合时的融合值,最大融合策略对应的声门闭合时刻(GCI)提取算法为GMATmax;p2(n)表示采用乘积融合时的融合值,乘积整合策略对应的GCI提取算法为GMATprod;p3(n)表示采用均值融合时的融合值;均值融合策略对应的GCI提取算法为GMATmean;
S5、采用下述高通滤波器检测幅度陡增时刻:
其中j为循环变量,Tl代表计算平均幅度时的窗口大小,q1(n)、q2(n)、q3(n)分别表示采用GMATmax、GMATprod和GMATmean方法时,幅度陡增后与陡增前的平均幅度差值,分别利用q1(n)、q2(n)、q3(n)中的过零点切割出幅度为正的区域,将信号分割成多个区域,且每个区域内包含一个GCI真值,这个区域则为我们分割出来的一个周期;
S6、根据GMATmax、GMATprod和GMATmean方法测出的周期Tmax、Tprod、Tmean,从检测率、漏检率、误检率、检测准确度、检测偏差五个方面评估三种尺度算法的可靠性与准确性,根据对性能要求的不同选择合适的尺度进行周期分割。
2.根据权利要求1所述的基于多尺度非线性能量算子的语音信号周期分割方法,其特征在于:样本点x(n-L)或x(n+L)与x(n)的时间距离等于尺度参数L。
3.根据权利要求1所述的基于多尺度非线性能量算子的语音信号周期分割方法,其特征在于:步骤S5中,采用GMATmax方法时,对分割中的每个区域,检测q1(n)幅度最高时的时刻,并记为n11,同时检测该区域内p1(n)中幅度最高的三个点,并将这三个点中与n11时间距离最近的点记为n12。
4.根据权利要求3所述的基于多尺度非线性能量算子的语音信号周期分割方法,其特征在于:将n11与n12的平均值作为该区域内的GCI值。
5.根据权利要求1所述的基于多尺度非线性能量算子的语音信号周期分割方法,其特征在于:步骤S5中,采用GMATprod方法时,对分割中的每个区域,检测q2(n)幅度最高时的时刻,并记为n21,同时检测该区域内p2(n)中幅度最高的三个点,并将这三个点中与n21时间距离最近的点记为n22。
6.根据权利要求5所述的基于多尺度非线性能量算子的语音信号周期分割方法,其特征在于:将n21与n22的平均值作为该区域内的GCI值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江中点人工智能科技有限公司,未经浙江中点人工智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810640530.0/1.html,转载请声明来源钻瓜专利网。