[发明专利]基于环境噪声变化检测的说话人语音回放鉴别方法及系统有效
申请号: | 201611062202.4 | 申请日: | 2016-11-23 |
公开(公告)号: | CN106531172B | 公开(公告)日: | 2019-06-14 |
发明(设计)人: | 张帆;张良 | 申请(专利权)人: | 湖北大学 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L25/21;G10L25/51;G10L25/84 |
代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 李振文 |
地址: | 430062 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种说话人语音回放鉴别方法及系统,属于,具体涉及一种基于环境噪声变化检测的说话人语音回放鉴别方法及系统。本发明通过对待检测语音前后环境噪声的变化,检测是否因为录音设备的播放而引入了新的噪声(包括由播放设备信道特征引入的噪声),从而判断是否为录音回放,使得可以再不依赖特定文本的语音检测中,实现ASV系统的录音回放攻击检测,可以防止ASV系统因录音回放攻击而引起的安全隐患,完善声纹认证的安全保障;同时由于是对播放设备的检测,因此对于语音合成入侵和语音转换入侵的检测,也具有辅助作用。 | ||
搜索关键词: | 基于 环境噪声 变化 检测 说话 人语 回放 鉴别方法 系统 | ||
【主权项】:
1.一种基于环境噪声变化检测的说话人录音回放鉴别方法,其特征在于,包括:背景噪声特征提取步骤,用于提取待测语音信号前预设时段语音信号的功率谱特征作为背景噪声能量特征值;静音段特征提取步骤,用于从待测语音信号中划分出静音段并计算静音段语音帧的平均功率谱特征值作为待测信号静音段特征值;语音回放判断步骤,用于将背景噪声能量特征值与待测信号静音段特征值进行比较,若两者特征变化超过阈值,则判断为录音回放;其中,所述背景噪声特征提取步骤中,基于以下步骤计算背景环境噪声段终止时间:(1)对于说话人开始发声点Tv处,前移一小段时间至t时刻,计算t‑△t到t+△t之间的平均强度Pt,其中,△t为为预先设定的时间变化量,可根据使用环境与需求人工设定;(2)然后选择一步幅s,计算t‑s‑△t到t‑s+△t的平均强度Pt‑s,比较Pt和Pt‑s的差的绝对值是否小于预先给定的阈值;(3)若Pt和Pt‑s之间差的绝对值大于阈值,则表明临界点在t‑s和t之间,即可以t‑s为背景环境噪声临界点的终止时刻;(4)若Pt和Pt‑s之间差的绝对值小于阈值,则表明从t‑s到t时间段内,噪声强度没有发生明显变化,即表征没有找到临界点或临界点不存在,则继续以步幅s从t‑s开始向前移动,重复步骤(2);(5)若进过ns步后,仍未找到临界点,则表明在t‑ns到t时间段内,环境噪声无明显变化,则以Pt表示背景噪声强度,其中n为经验系数,预先设定。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北大学,未经湖北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611062202.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种单元线集装转运车
- 下一篇:一种新型落布接收装置的制作工艺