[发明专利]基于蚁群优化的基音频率检测方法有效
申请号: | 201610077857.2 | 申请日: | 2016-02-03 |
公开(公告)号: | CN107039051B | 公开(公告)日: | 2019-11-26 |
发明(设计)人: | 张小恒 | 申请(专利权)人: | 重庆工商职业学院 |
主分类号: | G10L25/90 | 分类号: | G10L25/90;G10L25/18 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 400052 重庆*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 优化 基音 频率 检测 方法 | ||
1.一种极低信噪比环境下的基音频率检测方法,其特征在于该方法包括以下步骤:
a.训练过程:
(1)对语音数据库按时间顺序作语音分帧{frm(1),frm(2),…,frm(N)},并利用标准算法提取语音帧的基音频率F0作为基音频率真实值,并构成序列{F0(1),F0(2),…,F0(N)},其中N为语音帧的总数;
(2)在纯净语音帧基础上叠加噪声制作新的语音分帧序列{frmnoise(1),frmnoise(2),…,frmnoise(N)},并利用PEFAC算法将语音帧信号转化为相对应的特征波形序列
(3)利用优化因子与特征波形一起构造蚁群适应度函数,并进行全局搜索,直至得到最佳优化因子,其中优化因子为未知的M维向量α=[α1,α2,…,αM],优化因子优化之后的特征波形构成新的特征波形序列提取特征波形的最大峰值peak和其所对应的频率值fpeak作为基音频率估计值,并形成序列{(peakmax(1),fpeak(1)),(peakmax(2),fpeak(2)),…,(peakmax(N),fpeak(N))},
蚁群信息素释放函数即基音频率估计值与真实值误差不超过5%的概率,然后设置蚁群算法的相关参数进行搜索,最终找出最佳的优化因子αoptimal;
b.测试过程:
(1)对测试语音信号进行分帧处理,并提取其基音特征波形
(2)利用最佳优化因子αoptimal优化,即构造优化后的基音特征波形
(3)识别并找出的最大峰值所对应的频率值作为基音频率的估计值。
2.根据权利要求1所述的基音频率检测方法,其特征在于该方法中的蚁群优化算法包括以下步骤:
步骤一:令α=[α1,α2,…,αi,…,αM],单维取值范围[xdown xup],搜索精度prec,则αi∈{xdown+prec,xdown+2*prec,…,xdown+L*prec},
其中,floor(·)为取整函数,α被划分为M×L个节点,节点αij与信息素τij及启发式信息ηij相关联,为αi=xdown+j*prec的期望,启发式信息ηij=1/Δdij,其中即为纯净语音环境下的基音特征波形与经优化后的基音特征波形之间的偏差;
步骤二:路径的构建,第k只蚂蚁走到节点(i,j)的概率为:
步骤三:信息素更新:当所有蚂蚁构建好路径,各节点上的信息素按如下公式更新:
第k只蚂蚁在所在节点上释放的信息素为
其中为路径Tk的适应度值;
步骤四:终止条件为满足最大迭代次数即可,此时最佳路径对应的α值即αoptimal。
3.根据权利要求1所述的基音频率检测方法,其特征在于该方法的参数设置为优化因子为10维向量,单维取值范围为0.5~1.5,基音特征波形为维度为250维的频域向量信号,频域跨度为60~400Hz的基音频域最大范围;蚁群训练参数设置如下:搜索精度0.01,α=2.5,β=2.5,ρ=0.5,蚁群总数为100,最大迭代次数为60。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆工商职业学院,未经重庆工商职业学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610077857.2/1.html,转载请声明来源钻瓜专利网。