[发明专利]一种语音端点检测方法及装置无效

专利信息
申请号: 201010609503.0 申请日: 2010-12-28
公开(公告)号: CN102097095A 公开(公告)日: 2011-06-15
发明(设计)人: 苏伟博 申请(专利权)人: 天津市亚安科技电子有限公司
主分类号: G10L11/00 分类号: G10L11/00
代理公司: 天津盛理知识产权代理有限公司 12209 代理人: 王来佳
地址: 300384 天津*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 语音 端点 检测 方法 装置
【说明书】:

技术领域

发明属于视频监控领域,尤其涉及一种语音端点检测方法及装置。

背景技术

目前,在实时视频监控中,利用拾音器拾取监控场景中的异常声音,从而调节摄像机光轴指向异常声音处,可以实现异常事件的实时监控。由于全向性拾音器可以拾取各个方向上的声音,因此可以有效解决传统视频监控中由于异常事件发生在监控摄像机视场盲区,不能迅速捕捉到异常事件发生的弊端。在视频监控中,利用拾音器拾取监控场景中的异常声音,最为关键的第一步就是语音端点检测技术。

传统的端点检测方法,如短时能量、过零率等算法,基于熵、零能积、熵与能量结合的改进算法,在平稳噪声或者高信噪比时性能较好。在低信噪比或者非平稳环境下,语音的短时能量容易与噪声混淆,过零率容易区分清音和噪声,但难以区分浊音和噪声,短时零能积方法在一定程度上可以提高端点检测的稳健性,但短时零能积特征参数抗噪声性能不及信息熵,从某种程度上讲,谱熵对噪声具有一定的稳健性,但当信噪比下降时,虽然谱熵的形状保持不变,但谱熵降低,而且传统基于谱熵的方法只考虑当前帧的频谱信息,在非平稳的噪声环境下噪声频谱信息熵波动范围很大,这给阈值选取带来了困难。

发明内容

本发明的目的在于提供一种可以有效的区分语音和非语音帧,对于低信噪比环境也有较好的检测效果的语音端点检测方法。

本发明实施例是这样实现的,一种语音端点检测方法,所述检测方法包括:

对输入语音信号进行数据采样,并对采样后的语音信号进行预处理;

对预处理过的语音信号加入汉明窗进行分帧处理,记为Rn(0<n≤N),N是帧的总数;

计算第n帧语音信号的频谱信息熵;

如果第n帧语音信号的频谱信息熵大于设定的阈值,将该帧判定为语音帧,否则判定为非语音帧。

本发明的目的还在于提供一种语音端点检测装置,其特征在于,所述检测装置包括:

语音信号采样处理单元,用于对输入语音信号进行数据采样,并对采样后的语音信号进行预处理;

语音信号分帧处理单元,对预处理过的语音信号加入汉明窗进行分帧处理,记为Rn(0<n≤N),N是帧的总数;

频谱信息熵计算单元,用于计算第n帧语音信号的频谱信息熵;

语音帧确定单元,用于如果第n帧语音信号的频谱信息熵大于设定的阈值,将该帧判定为语音帧,否则判定为非语音帧。

本发明的优点和积极效果是:

本发明应用了频谱熵作为语音和非语音的区分特征,可以有效的区分语音帧和非语音帧,对于低信噪比环境也有较好的检测效果,克服了传统的基于频谱熵的算法只考虑当前帧的频谱信息,在非平稳的噪声环境下噪声频谱信息熵波动很大,增加了阈值选择的难度的问题。

附图说明

图1是本发明实施例提供的语音端点检测方法的实现流程图;

图2是本发明的第一实施例的实现流程图;

图3是本发明实施例提供的语音端点检测装置的结构框图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明实施例提出了一种监控领域低信噪比下语音端点检测方法。该方法以子带频谱熵作为语音和非语音帧的区分特征,首先对每帧语音信号进行小波分解,获得不同频段的子带信号,然后对这些子带信号进行FFT变换,分别计算出各个子带的频谱熵,把前后相距若干帧的子带频谱熵通过一组顺序统计滤波器进行平滑处理,计算得到每帧的频谱熵,根据其值和设定的阈值判定语音帧和非语音帧,为了提高算法的精度,对阈值进行自适应修改。

图1示出了本发明实施例提供的语音端点检测方法的流程图。该方法包括:

在步骤S101中,对输入语音信号进行数据采样,并对采样后的语音信号进行预处理;

在步骤S102中,对预处理过的语音信号加入汉明窗进行分帧处理,记为Rn(0<n≤N),N是帧的总数;

在步骤S103中,计算第n帧语音信号的频谱信息熵;

在步骤S104中,如果第n帧语音信号的频谱信息熵大于设定的阈值,将该帧判定为语音帧,否则判定为非语音帧。

在步骤S105中,如果n>N则算法结束,否则返回到第2步。

作为本发明的第一实施例,如图2所示,一种语音端点检测方法,具体包括以下步骤:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津市亚安科技电子有限公司,未经天津市亚安科技电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010609503.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top