[发明专利]一种基于频域信息量分布的回放语音检测方法有效
申请号: | 201610023352.8 | 申请日: | 2016-01-14 |
公开(公告)号: | CN105513598B | 公开(公告)日: | 2019-04-23 |
发明(设计)人: | 王让定;陈亚楠;严迪群;金超;陶表犁;张立 | 申请(专利权)人: | 宁波大学 |
主分类号: | G10L17/14 | 分类号: | G10L17/14;G10L15/08 |
代理公司: | 宁波天一专利代理有限公司 33207 | 代理人: | 刘赛云 |
地址: | 315211 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 信息量 分布 回放 语音 检测 方法 | ||
1.一种基于频域信息量分布的回放语音检测方法,其特征在于该检测方法包括如下步骤:
步骤一、提取语音信号的语音频率信息量,设待测语音信号或原始语音信号为X,将待检测语音信号如下操作:
(1)将语音信号做分帧处理,设共T帧,然后第i帧语音采样值做N点离散傅里叶变换,所述N为256、512、1024;则第i帧短时傅里叶变换为按照公式一进行计算,
公式一,
式中:
——傅里叶变换数值;
——傅里叶变换的离散频率参数;
——语段语音信号中每个采样点;
(2)按照公式二对第j帧第i个频率点的频率值,求幅值;
公式二,
式中:
——第i帧j列的傅里叶变换数值;
——傅里叶变换的离散频率参数;
(3)按照公式三对第j点频率求其时间上的平均;
公式三,
式中:
——表示第j个频率值在时间上的平均;
——第i帧j列的傅里叶变换数值;
(4)按照公式四对总频率点上频率值求和;
公式四,
式中:
——表示各频率值之和;
——表示第j个频率值在时间上的平均;
(5)按照公式五求每一个频率点出现的概率;
公式五,
式中:
——表示第j个频率值占总频率值的比重;
——表示第j个频率值在时间上的平均;
——表示各频率值之和;
(6)按照公式六对第j频域点求信息量;
公式六,
式中:
——标志第j频率点的信息量;
——表示第j个频率值占总频率值得比重;
通过上述计算过程分别将待测语音信号和原始语音信号转换为一维数据;
步骤二、选取步骤一中语音信号的前N/2个频率点的信息量作为初步特征;
步骤三、从语音信号选取的初步特征中低频区特征提取部分中筛选特征集,并选取连续的频率点作为最终特征集;
步骤四:通过分类器分别对回放语音信号的特征集和原始语音信号的特征集进行训练模型,将待测语音在训练模型上进行测试,并由分类器最终判断待测语音信号是否为回放语音。
2.根据权利要求1所述的一种基于频域信息量分布的回放语音检测方法,其特征在于所述的特征集筛选工具为怀卡托智能分析环境Weka。
3.根据权利要求1所述的一种基于频域信息量分布的回放语音检测方法,其特征在于所述的分类器为LibSVM分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610023352.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能化信息技术播放设备
- 下一篇:一种语音驱动的智能人机交互方法