[发明专利]语音感知哈希认证的感知哈希值提取方法及认证方法有效

申请号：	201210409385.8	申请日：	2012-10-24
公开（公告）号：	CN102881291A	公开（公告）日：	2013-01-16
发明（设计）人：	张秋余;黄羿博;邸燕君;刘扬威;杨仲平;省鹏飞	申请（专利权）人：	兰州理工大学
主分类号：	G10L19/087	分类号：	G10L19/087
代理公司：	兰州振华专利代理有限责任公司 62102	代理人：	董斌
地址：	730050 ***	国省代码：	甘肃;62
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音感知认证哈希值提取方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.语音感知哈希认证的感知哈希值提取方法，其步骤为：

(1) 对语音信号A进行分帧，使用汉明窗进行加窗，帧长为20ms，帧移为10ms；

(2) 计算语音信号每帧的线性预测系数R和每帧的短时平均能量E；

(3) 用每帧的短时平均能量E替换每帧线性预测系数的第一个线性预测系数；

(4) 对短时平均能量与线性预测系数构成的矩阵进行分块处理；

(5) 对分块处理后的A_m分别进行奇异值分解，形成U、S和V三个矩阵；

(6) 使用奇异值分解后的U、V系数重构矩阵，构成W=UV矩阵；

(7) 计算重构矩阵的列的和s(i)；

(8) 对s(i)进行量化处理，形成感知哈希序列，量化规则为：

。

2.根据权利要求1所述的语音感知哈希认证的感知哈希值提取方法，其特征在于根据权利要求1中步骤(2)所述的计算原始语音信号每帧的线性预测系数R和每帧的短时平均能量E，按如下步骤进行：

(1) 语音信号经过加窗分帧处理后，得到的第N帧的语音信号为A_N(m)，则A_N(m)满足：

A_N(m) = W(m) A( m + n )

(2) 第n帧的能量E(n)为：

(3) LPC预测系数：

其中，n为语音信号的总帧数，p为线性预测器的阶数。

3.根据权利要求1所述的语音感知哈希认证的感知哈希值提取方法，其特征在于根据权利要求1中的步骤(3)所述的用每帧的短时平均能量E替换每帧线性预测系数的第一个预测函数R，按如下步骤进行：

(1) 求出的线性预测函数，得到的线性预测系数首位为1；

(2) 首位的1在进行后续奇异值分解时，会对分解后的矩阵产生影响，使得分解后的特征值区分性变差，将第一行去掉，产生新的预测系数矩阵；

(3) 可以将每一帧的能量E(n)添加到每一帧的线性预测系数的前面，也就是将1的位置替换掉；这样，使用每一帧的平均短时能量和线性预测系数来描述每一语音帧的特性；构成新的线性预测矩阵为：

。

4.根据权利要求1所述的语音感知哈希认证的感知哈希值提取方法，其特征在于根据权利要求1中的步骤(4)所述的对短时平均能量与线性预测系数构成的矩阵进行分块处理，按如下步骤进行：

(1) 矩阵分为m个p*p小矩阵

。

5.根据权利要求1所述的语音感知哈希认证的感知哈希值提取方法，其特征在于根据权利要求1中的步骤(5)所述的对分块处理后的A_m分别进行奇异值分解，形成U、S和V三个矩阵：

。

6.根据权利要求1所述的语音感知哈希认证的感知哈希值提取方法，其特征在于根据权利要求1中的步骤(6)所述的使用奇异值分解后的U、V系数重构矩阵，构成W=UV矩阵：

(1) 将矩阵UV进行拼接；

(2) 拼接矩阵的行为MAX（L_u，L_v）,列数小于MAX（L_u，L_v）的用0补齐，补的行数的大小为

J=MAX（L_u，L_v）- Min（L_u，L_v）

(3) 重复(1)、(2)直到求出所有分块矩阵的重构矩阵。

7.根据权利要求1所述的语音感知哈希认证的感知哈希值提取方法，其特征在于根据权利要求1中的步骤(7)所述的计算重构矩阵的列的和s(i)；按如下步骤进行：

(1) 对重构矩阵的每一列进行求和运算，得到每一列特征值的总和；

(2) 重复(1)，直到求出所有分块矩阵的每一列的特征值总和。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于兰州理工大学，未经兰州理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201210409385.8/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载