[发明专利]一种回声时延估计及追踪方法有效

专利信息
申请号: 201710373057.X 申请日: 2017-05-24
公开(公告)号: CN107333018B 公开(公告)日: 2019-11-15
发明(设计)人: 贺前华;王亚楼;陈柱良 申请(专利权)人: 华南理工大学
主分类号: H04M9/08 分类号: H04M9/08;G10L21/0208;G06K9/62
代理公司: 44245 广州市华学知识产权代理有限公司 代理人: 李斌<国际申请>=<国际公布>=<进入国
地址: 510640广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种回声时延估计及追踪方法,所述方法基于SVM分类器中标记音的嵌入/检测来估算回声时延,简化了音频特征提取的过程,同时利用基于人耳听觉掩蔽效应的心理声学模型,对嵌入的标记音的位置、幅值进行控制,以达到嵌入后无听觉失真的目的,最大化保证了原始远端信号的完整性和准确性,另外,标记音的嵌入程序和检测程序交替执行,对于每一次嵌入和检测到的标记音,执行范围检验,根据检验结果对回声时延进行更新,实现了对回声时延的动态追踪,相较于传统的互相关算法,具有实时性高、鲁棒性强、计算复杂度低的优点,而且该方法不依赖背景噪声与远端信号的独立性假设,具有更高的可靠性。
搜索关键词: 一种 回声 估计 追踪 方法
【主权项】:
1.一种回声时延估计及追踪方法,其特征在于,包括以下步骤:/n步骤1、选取三种频率、单位帧长的单频音频信号按等幅值叠加后归一化,合成单位幅值的原始标记音s,所述三种频率分别分布在语音信号的低频、中频和高频部分,具体频率值能够根据具体应用场景需要来设置;/n步骤2、收集正常纯净语音并进行分帧加窗后,按照标记音嵌入规则选择符合条件的帧并按照掩蔽效应的掩蔽阈值嵌入标记音,然后将嵌入标记音的信号和未嵌入标记音的信号作为SVM分类器的训练数据;/n步骤3、标记音嵌入模块接收下一帧远端信号,按照标记音嵌入规则判断是否符合嵌入标志音的信号,如不符合,考察下一帧,如符合则按照掩蔽效应的掩蔽阈值嵌入标记音,在成功嵌入后重置启动计时器T1和定时器T2,其中定时器T2设置为根据上一次时延估计值所计算的本次时延估计的最小值,如果本次标记音嵌入为第一次嵌入,则定时器T2设置为0,然后停止标记音嵌入模块的工作;/n步骤4、根据定时器T2的状态来决定是否进入标记音检测模块的检测流程,如果定时器T2还没超时或已经重置,循环进入下一帧的处理流程;当定时器T2超时且未关闭时,将近端信号的当前帧提取特征后输入SVM分类器,判断当前帧是否含有标记音,如果检测到标记音,则读取计时器T1的值作为当前时延估计值,然后利用时延估计范围检测当前时延估计值是否可靠,如果可靠,则将时延估计更新为当前估计值;如果不可靠,则将当前时延估计值丢弃,然后将定时器T2关闭,并开始标记音嵌入模块的工作,跳转到步骤3;/n具体地,在上述步骤中,所述标记音嵌入规则的构建方法为:/n(1)、对于第n帧,通过FFT计算当前帧的离散傅里叶变换后,利用周期图法计算功率谱S(k),然后根据心理声学理论的临界频带计算公式计算分别以f1、f2、f3为中心频率的临界频带W1、W2、W3,利用功率谱计算临界频带内能量:/n /n其中k∈Wi/n对于临界频带W1、W2、W3,分别算得临界频带能量E1、E2、E3,取其中的最小值作为当前第n帧的临界频带能量En:/nEn=min(E1,E2,E3);/n(2)、根据功率谱计算当前帧中对应选取的三种频率f1、f2、f3频率点的能量E1'、E2'、E3',取其中的最大值作为当前第n帧的频点能量En':/nEn'=max(E1',E2',E3');/n(3)、计算前一帧的临界频带能量En-1与当前帧的频点能量En'之比γ:/n /n当且仅当γ和En-1分别满足:/n /n则判定当前帧为可嵌入帧,其中γmin、Emin分别为最小能量比和掩蔽音最小能量,可根据具体实施场景确定,根据掩蔽效应中的后掩蔽理论很明显能够看到,γmin和Emin越大,对可嵌入帧的选择条件越苛刻,嵌入后掩蔽效果越好,同时越有利于标记音的检测;/n(4)、对于当前第n帧,如果上一步判定结果为可嵌入,计算当前帧的掩蔽阈值Tn:/n /n其中α为嵌入因子,在具体实施时取0.05~0.2;/n(5)、根据当前帧和前一帧的掩蔽阈值计算的加权平均计算标记音嵌入的幅度A:/nA=βTn-1+(1-β)Tn/n其中β为加权因子,在具体实施中取0.5~1;/n(6)、将原始标记音s的幅值扩大至A得到待嵌入标记信号s':/ns'=A·s/n然后将s'与当前帧相叠加得到嵌入后的帧信号。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710373057.X/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top