[发明专利]基于词根的英文电子文档水印嵌入和提取方法及系统在审
申请号: | 202211020501.7 | 申请日: | 2022-08-24 |
公开(公告)号: | CN115408669A | 公开(公告)日: | 2022-11-29 |
发明(设计)人: | 吴国华;饶思奇;张祯;王玉娟;袁理锋;王秋华;张国威 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06F21/16 | 分类号: | G06F21/16;G06F40/126;G06F40/289;G06V30/10 |
代理公司: | 浙江永鼎律师事务所 33233 | 代理人: | 周希良 |
地址: | 310018 浙江省杭州市杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 词根 英文 电子 文档 水印 嵌入 提取 方法 系统 | ||
本发明属于电子文件安全管理技术领域,具体涉及基于词根的英文电子文档水印嵌入和提取方法及系统。方法包括水印嵌入和水印提取;水印嵌入包括以下步骤:S1,替换字体文件;S2,分词处理;S3,词根提取;S4,词根编码;S5,水印信息嵌入;水印提取包括以下步骤:S6,图片获取;S7,文本识别;S8,图像处理;S9,词根提取;S10,词根匹配;S11,提取水印。本发明具有在拍照、截屏等操作后,依然能保证英文电子文档水印信息完整性的特点。
技术领域
本发明属于电子文件安全管理技术领域,具体涉及基于词根的英文电子文档水印嵌入和提取方法及系统。
背景技术
水印作为版权保护的一种手段,能够在文档中嵌入代表特定身份的信息。目前对于英文文档的水印嵌入方法,无法抵抗拍照,截图,打印等手段对水印造成的破坏。
因此,设计一种在拍照、截屏等操作后,依然能保证水印信息完整性的基于词根的英文电子文档水印嵌入和提取方法及系统,就显得十分重要。
例如,申请号为CN200510077471.3的中国专利文献描述的一种在英文文本中嵌入和提取水印的方法,将版权人的版权信息转化为二进制的比特位串;读入文本,滤除空格和特殊字符,对所得字符串及版权人私钥作哈希运算,得到整数Z;若Z整除嵌入比例,则下一句为水印信息句;用Z对版权信息比特串长度取余,确定其中待嵌入的水印信息比特;用Z对水印信息句字符数取余,确定水印信息比特的位置,使位置相邻两字母的编码大小关系代表的0、1,与待嵌入的水印信息比特相同,直到文本结束。水印信息提取为嵌入过程的逆过程。虽然水印隐秘性好,安全性高,尤其对于格式转换攻击有着完全的抗攻击能力,文本不会因为水印信息的存在而降低质量,但是其缺点在于,该方法通过读取英文文本的第一个句子,过滤空格和特殊字符后得到只包含英文字符的字符串,将字符串与私钥信息进行单独哈希运算的方法,达到嵌入水印的目的,在保证水印完整性方面具有一定的局限性。
发明内容
本发明是为了克服现有技术中,对英文电子文档水印嵌入过后,无法抵抗文件拍照、截屏等操作对水印信息破坏的问题,提供了一种在拍照、截屏等操作后,依然能保证水印信息完整性的基于词根的英文电子文档水印嵌入和提取方法及系统。
为了达到上述发明目的,本发明采用以下技术方案:
基于词根的英文电子文档水印嵌入和提取方法,包括水印嵌入和水印提取;
所述水印嵌入包括以下步骤:
S1,替换字体文件:
将原计算机英文字体文件通过变形处理,替换为新的英文字体文件;
S2,分词处理:
对新的英文字体文件做分词处理,生成包含整篇文件的单词集合;
S3,词根提取:
对步骤S2中生成的单词集合中的所有单词,提取单词中包含的词根;
S4,词根编码:
对提取的词根进行编码,用于承载比特信息“0”或“1”;
S5,水印信息嵌入:
用步骤S4中已经编码过的词根,替换英文字体文件中英文单词的原词根,完成水印信息的嵌入;
所述水印提取包括以下步骤:
S6,图片获取:
获取待提取水印的英文电子文档文本图片;
S7,文本识别:
对所述英文电子文档文本图片做文本识别处理,获取图片所包含的所有英文单词;
S8,图像处理:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211020501.7/2.html,转载请声明来源钻瓜专利网。