[发明专利]语音感知哈希认证的感知哈希值提取方法及认证方法有效
申请号: | 201210409385.8 | 申请日: | 2012-10-24 |
公开(公告)号: | CN102881291A | 公开(公告)日: | 2013-01-16 |
发明(设计)人: | 张秋余;黄羿博;邸燕君;刘扬威;杨仲平;省鹏飞 | 申请(专利权)人: | 兰州理工大学 |
主分类号: | G10L19/087 | 分类号: | G10L19/087 |
代理公司: | 兰州振华专利代理有限责任公司 62102 | 代理人: | 董斌 |
地址: | 730050 *** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 感知 认证 哈希值 提取 方法 | ||
1.语音感知哈希认证的感知哈希值提取方法,其步骤为:
(1) 对语音信号A进行分帧,使用汉明窗进行加窗,帧长为20ms,帧移为10ms;
(2) 计算语音信号每帧的线性预测系数R和每帧的短时平均能量E;
(3) 用每帧的短时平均能量E替换每帧线性预测系数的第一个线性预测系数;
(4) 对短时平均能量与线性预测系数构成的矩阵进行分块处理;
(5) 对分块处理后的Am分别进行奇异值分解,形成U、S和V三个矩阵;
(6) 使用奇异值分解后的U、V系数重构矩阵,构成W=UV矩阵;
(7) 计算重构矩阵的列的和s(i);
(8) 对s(i)进行量化处理,形成感知哈希序列,量化规则为:
。
2.根据权利要求1所述的语音感知哈希认证的感知哈希值提取方法,其特征在于根据权利要求1中步骤(2)所述的计算原始语音信号每帧的线性预测系数R和每帧的短时平均能量E,按如下步骤进行:
(1) 语音信号经过加窗分帧处理后,得到的第N帧的语音信号为AN(m),则AN(m)满足:
AN(m) = W(m) A( m + n )
(2) 第n帧的能量E(n)为:
(3) LPC预测系数:
其中,n为语音信号的总帧数,p为线性预测器的阶数。
3.根据权利要求1所述的语音感知哈希认证的感知哈希值提取方法,其特征在于根据权利要求1中的步骤(3)所述的用每帧的短时平均能量E替换每帧线性预测系数的第一个预测函数R,按如下步骤进行:
(1) 求出的线性预测函数,得到的线性预测系数首位为1;
(2) 首位的1在进行后续奇异值分解时,会对分解后的矩阵产生影响,使得分解后的特征值区分性变差,将第一行去掉,产生新的预测系数矩阵;
(3) 可以将每一帧的能量E(n)添加到每一帧的线性预测系数的前面,也就是将1的位置替换掉;这样,使用每一帧的平均短时能量和线性预测系数来描述每一语音帧的特性;构成新的线性预测矩阵为:
。
4.根据权利要求1所述的语音感知哈希认证的感知哈希值提取方法,其特征在于根据权利要求1中的步骤(4)所述的对短时平均能量与线性预测系数构成的矩阵进行分块处理,按如下步骤进行:
(1) 矩阵分为m个p*p小矩阵
。
5.根据权利要求1所述的语音感知哈希认证的感知哈希值提取方法,其特征在于根据权利要求1中的步骤(5)所述的对分块处理后的Am分别进行奇异值分解,形成U、S和V三个矩阵:
。
6.根据权利要求1所述的语音感知哈希认证的感知哈希值提取方法,其特征在于根据权利要求1中的步骤(6)所述的使用奇异值分解后的U、V系数重构矩阵,构成W=UV矩阵:
(1) 将矩阵UV进行拼接;
(2) 拼接矩阵的行为MAX(Lu,Lv),列数小于MAX(Lu,Lv)的用0补齐,补的行数的大小为
J=MAX(Lu,Lv)- Min(Lu,Lv)
(3) 重复(1)、(2)直到求出所有分块矩阵的重构矩阵。
7.根据权利要求1所述的语音感知哈希认证的感知哈希值提取方法,其特征在于根据权利要求1中的步骤(7)所述的计算重构矩阵的列的和s(i);按如下步骤进行:
(1) 对重构矩阵的每一列进行求和运算,得到每一列特征值的总和;
(2) 重复(1),直到求出所有分块矩阵的每一列的特征值总和。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于兰州理工大学,未经兰州理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210409385.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种湿帘纸的制备方法
- 下一篇:物体扫描夹具