[发明专利]G.729A压缩语音流信息隐藏检测装置及检测方法有效
申请号: | 201110435163.9 | 申请日: | 2011-12-22 |
公开(公告)号: | CN102568469A | 公开(公告)日: | 2012-07-11 |
发明(设计)人: | 李松斌;黄永峰 | 申请(专利权)人: | 清华大学 |
主分类号: | G10L11/00 | 分类号: | G10L11/00 |
代理公司: | 北京中伟智信专利商标代理事务所 11325 | 代理人: | 张岱 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 729 压缩 语音 信息 隐藏 检测 装置 方法 | ||
技术领域
本发明涉及信息隐藏检测领域,尤其涉及一种G.729A压缩语音流信息隐藏检测装置及检测方法。
背景技术
近年来,随着带宽的持续增长以及网络融合趋势的增强,VoIP逐渐成为因特网中一个非常流行的流媒体通信服务,在全球范围内得到广泛应用,彻底变革了语音通信市场格局,它所产生的网络流量在持续增长,这使VoIP非常适合用于在IP网络中进行隐蔽通信。G.729标准是ITU定义的VoIP语音编码标准,其简化版本G.729A在VoIP得到广泛应用。这使G.729A压缩语音流成为一种潜在的极具威胁的信息隐藏载体,利用它进行隐蔽通信将对国家通信监管形成巨大威胁,研究基于该载体的信息隐藏检测方法很有必要。信息隐藏检测(亦称隐写检测)就是判断所观察到的载体数据中是否存在隐藏信息。
当前在语音中进行信息隐藏的方法可大致分为以下几类:其一是针对脉冲编码调制语音数据的最低有效位替换或匹配方法;其二是变换域方法,该方法先将载体数据变换到变换域,然后通过在变换域修改一些参数实现机密信息的嵌入,常用的变换包括倒谱变换,离散余弦变换、离散小波变换等;其三是基于量化索引调制(Quantization Index Modulation,QIM)的方法,适用于包含矢量量化的数字音频、图像和视频编码。这三类方法中基于QIM机制的信息隐藏方法具有运算简单速度快,可用于在压缩编码过程中进行信息隐藏等特点,特别适合用于在G.729A语音流中进行信息隐藏,其对国家通信安全的威胁也最大。
发明内容
针对上述问题,本发明的目的在于提供一种G.729A压缩语音流信息隐藏检测装置及检测方法,应用于检测在基于G.729A标准的语音编码过程中使用经CNV(互相邻居节点)算法优化划分的分组矢量码本进行QIM信息隐藏的检测。
为达到上述目的,本发明所述一种G.729A压缩语音流信息隐藏检测装置,至少包括压缩语音流映射音素序列模块、音素序列特征提取模块组、分类器装置以及结果集成模块,其中;
压缩语音流映射音素序列模块,接收外部输送来的压缩语音流,映射成音素序列并输出;
音素序列特征提取模块组,分别提取音素序列的音素向量空间特征向量和音素状态转移一阶马尔科夫特征向量并输出;
分类器装置,基于训练集对不同特征向量分别训练分类器,然后对于未知类别的样本使用训练获得分类器进行分类并输出分类结果;
结果集成模块,对多个分类器的输出结果进行集成并输出作为最终的隐写检测结果。
优选地,所述音素序列特征提取模块组包括PVSF特征提取模块和FOMF特征提取模块,其中;
PVSF特征提取模块,提取音素序列的音素向量空间特征向量并输出;
FOMF特征提取模块,提取音素状态转移一阶马尔科夫特征向量并输出。
优选地,所述分类训练装置包括第一分类器、第二分类器及第三分类器,其中,
第一分类器,基于音素向量空间特征向量进行训练得到分类器后利用该分类器对未知类别样本进行预测并输出结果给集成模块;
第二分类器,基于音素向量空间特征向量和音素状态转移一阶马尔科夫特征向量的融合特征向量进行训练得到分类器后利用该分类器对未知类别样本进行预测并输出结果给集成模块;
第三分类器,基于音素状态转移一阶马尔科夫特征向量进行训练得到分类器后利用该分类器对未知类别样本进行预测并输出结果给集成模块。
为达到上述目的,本发明所述一种G.729A压缩语音流信息隐藏检测方法,包括以下步骤:
将压缩语音流映射成音素序列;
分别提取音素序列的音素向量空间特征向量和音素状态转移一阶马尔科夫特征向量;
对多种特征向量分别训练分类器,并将多个分类器的分类结果基于多数投票机制进行集成作为最终的分类结果。
优选地,所述将压缩语音流映射成音素序列的方法为:设定语音所包含的音素为有限个,将待映射语音分割为各个音素对应的语音小片,取小片的时长为G.729A的帧长。
优选地,所述音素序列特征提取方法为:
使用音素发音时的声道参数作为音素的量化描述,使用G.729A中的LPC滤波器表征声道参数,LPC滤波器由量化索引确定,将每个音素对应到LPC滤波器量化索引的第一个域,使用该域形成序列的统计特征作为音素序列的统计特征;
使用音素向量空间特征向量量化提取G.729A语音所包含音素的分布不均衡性;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110435163.9/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置