[发明专利]一种文档水印检测与识别系统在审
申请号: | 201910098013.X | 申请日: | 2019-01-31 |
公开(公告)号: | CN109857896A | 公开(公告)日: | 2019-06-07 |
发明(设计)人: | 戴炳荣;王凌;李顿伟;高洪美;蒋存峰;陈美;张绍华 | 申请(专利权)人: | 上海计算机软件技术开发中心 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/53;G06F16/93;G06T1/00 |
代理公司: | 上海伯瑞杰知识产权代理有限公司 31227 | 代理人: | 孟旭彤 |
地址: | 201112 上海市闵*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档水印 水印图像 文档上传 结果显示模块 文档格式转换 检测 比对模块 编码模块 识别系统 提取模块 比对 数据库 文本 图像格式 文本信息 文档格式 文档图像 文档转换 上传 文档 保存 中文 重复 | ||
1.一种文档水印检测与识别系统,其特征在于,包括文档上传模块、文档格式转换模块、文档水印提取模块、文档水印编码模块、文档水印比对模块和结果显示模块,
所述文档上传模块用于待检测文档上传,文档格式包括word格式和pdf格式;
所述文档格式转换模块用于将上传的文档转换成图像格式以便于后续检测;
所述文档水印提取模块用于在文档图像中提取并保存其水印图像;
所述文档水印编码模块用于将水印图像编码成文本信息便于后续比对;
所述文档水印比对模块用于对水印图像文本与数据库中的水印图像文本进行比对;
所述结果显示模块用于显示该文档是否与数据库中文档重复。
2.根据权利要求1所述的文档水印检测与识别系统,其特征在于,所述文档格式转换模块,将上传的文档转换成图片格式,首先将上传的word格式转换成pdf格式,再将pdf格式文本转换成图片。
3.根据权利要求1所述的文档水印检测与识别系统,其特征在于,所述文档水印提取模块,通过图像处理的方法将文档图片中除水印以外的信息全部去除,只保留水印图片。
4.根据权利要求1所述的文档水印检测与识别系统,其特征在于,所述文档水印编码模块采用感知哈希算法将水印图像转化为文本内容便于图像检索。
5.根据权利要求1所述的文档水印检测与识别系统,其特征在于,所述文档水印比对模块使用汉明距离来检索生成文本中与数据库中的水印图片所转化成的文本进行比对。
6.根据权利要求3所述的文档水印检测与识别系统,其特征在于,所述文档水印提取模块中图像处理过程包括对图像灰度化、灰度提取、灰度增强、中值滤波和输出结果。
7.根据权利要求4所述的文档水印检测与识别系统,其特征在于,所述文档水印编码模块以感知哈希算法将图片编码为文本值,具体过程包括缩放图片、图像灰度化、像素间强度的差异计算、转换hash值。
8.根据权利要求7所述的文档水印检测与识别系统,其特征在于,通过dHash值计算两张图片的汉明距离,通过汉明距离的大小,判断两张图片的相似程度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海计算机软件技术开发中心,未经上海计算机软件技术开发中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910098013.X/1.html,转载请声明来源钻瓜专利网。