[发明专利]基于变分自动编码器的数字媒体保护文本隐写方法在审
申请号: | 202111311802.0 | 申请日: | 2021-11-08 |
公开(公告)号: | CN113987129A | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 刘红;李政;肖云鹏;李暾;贾朝龙;王蓉 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/279;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 重庆辉腾律师事务所 50215 | 代理人: | 王海军 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 自动 编码器 数字 媒体 保护 文本 方法 | ||
本发明属于信息安全领域,特别涉及一种基于变分自动编码器的数字媒体保护文本隐写方法,包括构建由编码网络、高斯采样以及解码网络构成的神经网络模型,将文本向量化;利用编码网络分别获取全局关键词和长序列的特征,并融合全局关键词和长序列的特征获取全局特征表示;利用高斯采样对编码网络中的全局特征表示进行高斯采样;利用解码网络对高斯采样的采样结果进行解码,获取文本的条件概率分布;选择条件概率最大的K个词,使用哈夫曼编码来选择同秘密比特流相对应的一个单词,完成文件的隐写;本发明不仅能够生成长而多样的隐写文本,使得隐写文本能携带更多的秘密信息,而且实现自然语言和隐写文本视觉不可区分、统计不可区分和语义不可区分。
技术领域
本发明属于信息安全领域,特别涉及一种基于变分自动编码器的数字媒体保护文本隐写方法。
背景技术
信息隐藏技术的研究最早源于国外,在1999年全国信息隐藏暨多媒体信息安全学术大会的成功召开之后开始渐渐地流入到国内,成为一个新兴的研究领域。在信息隐藏技术中,隐写术、数字水印等用来解决隐蔽通信、数字取证和版权保护等安全问题。隐写术作为信息隐藏中的关键性的技术之一,其实质是将秘密信息嵌入到载体数据中,隐藏通信的存在,使得攻击者从外观上无法得知该信息是否含有秘密信息。而数字水印是指将特定的数字信息(如身份信息、序列号、文字等)嵌入到图像、音频或视频等数字产品中,多用于版权保护。与数字水印技术相比,隐写术可嵌入更多的秘密信息,且隐藏信息的方法无规律可循,增加了攻击的难度。
隐写术多使用各种多媒体信息载体来实现秘密信息的隐藏,其中包括文本、图像、视频和音频等公开的载体。文本作为人们日常通信及发表观点时使用最为广泛的信息载体,对其进行处理有着重大的研究价值和现实意义。文本隐写技术是指将秘密信息隐藏到公开传递的文件或文档中,以实现秘密信息的隐蔽传递。与基于图像、音频和视频的信息隐藏技术相比,文本具有更高的编码效率、较小的修改冗余,且任何比特的改变都可能使文本发生可感知的变化,如何巧妙地使用文本携带秘密信息来进行秘密信息的交流,是近年来信息隐藏领域里研究的热点问题之一。
文本是信息交流与信息传递的重要载体,广泛的应用在人们的生活生产中,这为文本隐写术的发展奠定了良好的基础。传统的文本隐写术多是基于载体的方法,其主要是通过修改文本的编码方式、排列格式、字体大小和位置等方式来完成秘密信息的嵌入,以实现文本隐写。虽然这些传统的文本隐写技术的确能为我们解决传递秘密信息的问题,但是针对这些传统的隐写技术,不管怎样提高其隐藏容量,改进隐藏与提取算法,最终都需要对载体进行修改,不可避免的将修改痕迹留在了载体上,使得文本载体难以抵抗各类隐写分析工具检测的问题,为攻击者提供了机会。
针对传统的文本信息隐藏易被隐写分析工具检测的不足,研究者们提出了一种新的无载体信息隐藏方案来提高信息隐藏的抗检测性。无载体文本隐写方法旨在通过寻找一种公开的含密载体来传递秘密信息,根据载体的特征建立载体信息与秘密信息之间的映射关系(并非不需要载体),以解决传统信息隐藏技术由于载体修改痕迹易被第三方攻击的问题。随着自然语言处理技术的发展,研究者将基于深度学习的文本自动生成技术与信息隐藏结合,提出了有关自动生成文本隐写的信息隐藏方法,实现了无载体的文本隐写技术。基于深度学习的文本隐写方法通常都是使用大量的语料库来训练文本关系模型,秘密信息发送者将秘密信息转换为秘密比特流,以一种编码规则使用秘密比特流来自动地选择待生成的文本,以此来完成数据隐藏,实现数据隐写,而秘密信息接收者使用同发送者相同的语言模型或数据集,从隐写文本中提取出嵌入的秘密信息。
虽然众多学者对隐写文本生成模型进行了大量的研究,并取得了相当不错的成果,但仍存在一些挑战:
1.长隐写文本生成的困难性。生成长的隐写文本,需要同时考虑短句的上下文相关性,通过组合短句来构造长文本的生成,因此不仅需要考虑词-词之间的文本相关性,还需要考虑句子-句子之间的上下文相关性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111311802.0/2.html,转载请声明来源钻瓜专利网。