[发明专利]文档处理方法、装置、设备、存储介质和计算机程序产品在审
申请号: | 202011528099.4 | 申请日: | 2020-12-22 |
公开(公告)号: | CN112529759A | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 范昕曈;徐明;于一笑 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06T1/00 | 分类号: | G06T1/00;G06F21/62;G06Q50/18 |
代理公司: | 北京天昊联合知识产权代理有限公司 11112 | 代理人: | 彭瑞欣;冯建基 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 处理 方法 装置 设备 存储 介质 计算机 程序 产品 | ||
1.一种文档处理方法,包括:
对预定文档的解压缩数据所包含的中央目录记录结尾数据块进行解析,得到所述预定文档的中央目录记录的信息;
通过解析所述预定文档的中央目录记录的信息,从所述解压缩数据中获取所述预定文档的用于设置文档属性的文件目录地址;
在所述用于设置文档属性的文件目录地址下,通过自定义属性文件记录预设水印信息的字符串信息,得到所述预定文档的暗水印信息;
对包含所述暗水印信息的预定文档的解压缩数据进行压缩处理,得到包含所述暗水印信息的新的文档。
2.根据权利要求1所述的方法,其中,所述对预定文档的解压缩数据所包含的中央目录记录结尾数据块进行解析,包括:
在接收到首次上传的所述预定文档的情况下,对所述中央目录记录结尾数据块进行解析;或者,
在所述预定文档为已上传文档且未包含所述暗水印信息的情况下,对所述中央目录记录结尾数据块进行解析。
3.根据权利要求1所述的方法,其中,所述中央目录记录的信息至少包括:所述中央目录记录的地址和所述中央目录记录的大小;
所述通过解析所述预定文档的中央目录记录的信息,从所述解压缩数据中获取所述预定文档的用于设置文档属性的文件目录地址,包括:
根据所述中央目录记录的大小和所述中央目录记录的地址,确定所述中央目录记录的起始位置和结束位置;
读取并解析位于所述中央目录记录的起始位置和结束位置之间的信息,得到多个数据块的信息;
从所述多个数据块的信息中,获取第一类型文件的信息和第二类型文件的信息,所述第一类型文件用于记录所述解压缩数据中所包含文件的名称及类型,所述第二类型文件用于记录所述解压缩数据中所包含文件之间的关系;
将所述用于设置文档属性内容的文件作为第三类型文件,根据所述第一类型文件中记录的所述文件名称及类型,以及所述第二类型文件记录的所述文件之间的关系,确定所述第三类型文件的文件目录地址。
4.根据权利要求1所述的方法,其中,在所述用于设置文档属性的文件目录地址下未包含所述自定义属性文件的情况下,所述方法还包括:
在所述用于设置文档属性的文件目录地址下,创建自定义属性文件;
通过创建的所述自定义属性文件,记录预设水印信息的字符串信息,得到所述预定文档的暗水印信息。
5.根据权利要求1所述的方法,其中,所述新的文档中还包括文件加密信息,所述中央目录记录结尾数据块中还包括注释字段的长度和所述注释字段的地址;
所述对包含所述暗水印信息的预定文档的解压缩数据进行压缩处理,得到包含所述暗水印信息的新的文档,包括:
根据所述注释字段的长度,计算所述注释字段的大小;
根据所述注释字段的大小和所述注释字段的地址,确定所述注释字段的开始位置和结束位置,删除所述注释字段的开始位置和结束位置之间的注释内容;
利用所述注释字段的开始位置和结束位置之间的存储区域,记录所述预定文档的文件加密信息;
对包含所述暗水印信息和所述文件加密信息的预定文档的解压缩数据进行压缩处理,得到包含所述暗水印信息和所述文件加密信息的新的文档。
6.根据权利要求1-5中任一项所述的方法,还包括:
通过预设的机器学习模型,生成所述预定文档的特征图谱;
对所述预定文档所属文档管理服务器之外的其他文档管理服务器所包含的文档进行监控;
在监控到所述其他文档管理服务器所包含的文档的特征图谱,与所述预定文档的特征图谱之间的距离小于或等于预设距离阈值的情况下,将与所述预定文档特征图谱距离相近的文档作为疑似被盗版文档;
读取所述疑似被盗版文档的暗水印信息,并通过比较所述疑似被盗版文档的暗水印信息与所述预定文档所包含的所述暗水印信息,确定所述疑似被盗版文档是否侵权。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011528099.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:串联双电机动力系统
- 下一篇:一种提升光纤陀螺应力和温度性能的光纤环绕制方法