[发明专利]基于蚁群优化的基音频率检测方法有效
申请号: | 201610077857.2 | 申请日: | 2016-02-03 |
公开(公告)号: | CN107039051B | 公开(公告)日: | 2019-11-26 |
发明(设计)人: | 张小恒 | 申请(专利权)人: | 重庆工商职业学院 |
主分类号: | G10L25/90 | 分类号: | G10L25/90;G10L25/18 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 400052 重庆*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 优化 基音 频率 检测 方法 | ||
本发明提供一种极低信噪比环境下的基音频率检测方法。其特征在于利用PEFAC算法提取语音帧信号的特征波形,然后利用最佳优化因子对特征波形进行优化从而构造新的特征波形,最后找出特征波形最大峰值所对应的频率值作为基音频率的估计值。其中最佳优化因子依靠蚁群优化(ACO)算法搜索得到。
技术领域
本发明涉及基音频率检测方法,特别是一种极低信噪比环境下的基音频率检测方法。
背景技术
基音频率检测作为语音的基本参数,在语音分析合成以及语音分离等语音处理领域有着广泛的用途。准确可靠地估计并提取基音频率对语音信号处理至关重要。高信噪比的基音频率检测已经十分成熟,但这些方法在低信噪比环境下难以较好效果,特别是极低信噪比环境下的检测效果很差。鉴于此,本发明提供一种极低信噪比环境下的基音频率检测方法。
发明内容
针对现有技术在极低信噪比环境下的进行基音频率检测有着明显不足,本发明提供了一种极低信噪比环境下的基音频率检测方法。该方法包括以下步骤:
1.训练过程:
(1)对语音数据库按时间顺序作语音分帧{frm(1),frm(2),…,frm(N)},并利用标准算法提取语音帧的基音频率F0作为基音频率真实值,并构成序列{F0(1),F0(2),…,F0(N)},其中N为语音帧的总数;
(2)在纯净语音帧基础上叠加噪声制作新的语音分帧序列{frmnoise(1),frmnoise(2),…,frmnoise(N)},并利用PEFAC算法将语音帧信号转化为相对应的特征波形序列
(3)利用优化因子与特征波形一起构造蚁群路径的适应度函数,并进行全局搜索,直至得到最佳优化因子。其中优化因子为未知的M维向量α=[α1,α2,…,αM],优化因子优化之后的特征波形构成新的特征波形序列提取特征波形的最大峰值peak和其所对应的频率值fpeak作为基音频率估计值,并形成序列{(peakmax(1),fpeak(1)),(peakmax(2),fpeak(2)),…,(peakmax(N),fpeak(N))},蚁群路径直接决定α值,则蚁群路径的适应度函数为即基音频率估计值与真实值误差不超过5%的概率。然后设置蚁群(ACO)算法的相关参数进行搜索,最终找出最佳的优化因子αoptimal。
蚁群的训练过程具体步骤为:
步骤一:令α=[α1,α2,…,αi,…,αM],单维取值范围[xdown xup],搜索精度prec,则αi∈{xdown+prec,xdown+2*prec,…,xdown+L*prec},
其中,floor(·)为取整函数。α被划分为M×L个节点,节点αij与信息素τij及启发式信息ηij相关联,为αi=xdown+j*preci的期望,启发式信息ηij=1/Δdij,其中即为纯净语音环境下的基音特征波形与经优化后的基音特征波形之间的偏差;
步骤二:路径的构建,第k只蚂蚁走到节点(i,j)的概率为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆工商职业学院,未经重庆工商职业学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610077857.2/2.html,转载请声明来源钻瓜专利网。