[发明专利]文档检索方法、装置、服务器以及存储介质在审
| 申请号: | 202110732780.9 | 申请日: | 2021-06-29 |
| 公开(公告)号: | CN113434710A | 公开(公告)日: | 2021-09-24 |
| 发明(设计)人: | 陈晟豪 | 申请(专利权)人: | 平安普惠企业管理有限公司 |
| 主分类号: | G06F16/43 | 分类号: | G06F16/43;G06F16/483;G06F21/60 |
| 代理公司: | 深圳市力道知识产权代理事务所(普通合伙) 44507 | 代理人: | 张传义 |
| 地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文档 检索 方法 装置 服务器 以及 存储 介质 | ||
1.一种文档检索方法,其特征在于,包括:
获取文档中的图片,并将所述图片进行压缩处理,以获得第一图片;
获取所述第一图片的颜色属性信息,并根据所述颜色属性信息匹配所述第一图片的图片转换模式,以根据所述图片转换模式将所述第一图片转换为第二图片,其中,所述第一图片及所述第二图片的图片属性不同;
获取所述第二图片的平均灰度值及所述第二图片每个像素点的像素灰度值,并根据所述平均灰度值及所述像素灰度值确定所述第二图片的图片特征签名值;
获取所述文档中的文字信息,并根据所述文字信息提取所述文档对应的文字特征签名值;
根据所述图片特征签名值以及所述文字特征签名值确定所述文档的文档特征签名;
获取保存所述文档的地址路径,根据所述文档特征签名与所述地址路径建立文档检索模型,以根据所述文档检索模型建立文档检索数据库;
当接收到文档检索指令时,根据所述文档检索指令确定待检索信息,并从所述文档检索数据库中匹配与所述待检索信息对应的文件。
2.根据权利要求1所述的方法,其特征在于,所述获取文档中的图片,并将所述图片进行压缩处理,以获得第一图片,包括:
获取所述文档中的图片,并检测所述图片的对应的图片属性信息;
根据所述图片属性信息判断所述图片存储时所需的存储空间是否超过预设值;
当所述图片存储时所需的存储空间未超过所述预设值时,将所述图片进行压缩处理,以获取所述第一图片;
当所述图片存储时所需的存储空间超过所述预设值时,将所述图片切割为多个子图片,并对多个所述子图片进行压缩处理,以获取所述第一图片。
3.根据权利要求2所述的方法,其特征在于,所述将所述图片切割为多个子图片,并对多个所述子图片进行压缩处理,以获取所述第一图片,包括:
将所述图片切割为多个子图片,并获取所述子图片的尺寸信息;
根据所述尺寸信息、及预设尺寸信息将所述子图片进行压缩处理以获取对应的目标分片;
根据多个所述目标分片获取所述第一图片。
4.根据权利要求1所述的方法,其特征在于,所述根据所述颜色属性信息匹配所述第一图片的图片转换模式,以根据所述图片转换模式将所述第一图片转换为第二图片,包括:
当所述第一图片的颜色属性信息满足第一条件时,将所述第一图片划分为多个第一子图片,对多个所述第一子图片进行灰度化处理得到多个灰度化图片,并从中选取灰度方差最大的所述灰度图片作为第二图片;
当所述第一图片的颜色属性信息不满足第一条件时,将所述第一图片压缩并进行灰度化灰度化处理,以得到第二图片。
5.根据权利要求1所述的方法,其特征在于,所述根据所述文字信息提取所述文档对应的文字特征签名值,包括:
根据预设字符集合,对所述文字信息进行字符提取,获得第一文字信息;
将所述第一文字信息按预设位数进行拆分,得到第一文字拆分数组;
对所述第一文字拆分数组的元素进行编码,得到第一编码数组;
对所述第一编码数组中的元素进行加密处理,并对加密结果进行截取,获得第一加密数组;
对所述第一加密数组中的元素进行二进制转换,得到第一特征数组;
根据所述第一特征数组,得到所述文字特征签名。
6.根据权利要求1所述的方法,其特征在于,所述当接收到文档检索指令时,根据所述文档检索指令确定待检索信息,并从所述文档检索数据库中匹配与所述待检索信息对应的文件,包括:
接收到文档检索指令时,根据所述文档检索指令确定待检索信息,并根据所述待检索信息确定搜索匹配签名值;
从所述文档检索数据库中匹配与所述搜索匹配签名值对应的文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安普惠企业管理有限公司,未经平安普惠企业管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110732780.9/1.html,转载请声明来源钻瓜专利网。





