[发明专利]截图、电子文档的识别方法、系统、终端、介质在审

专利信息
申请号: 202110315489.1 申请日: 2021-03-24
公开(公告)号: CN113065563A 公开(公告)日: 2021-07-02
发明(设计)人: 胡志强;石珺;李志鹏;黄晓明;易勇;金平艳 申请(专利权)人: 深圳市网联安瑞网络科技有限公司
主分类号: G06K9/34 分类号: G06K9/34
代理公司: 深圳壹舟知识产权代理事务所(普通合伙) 44331 代理人: 寇闯
地址: 518000 广东省深圳市福田区华富街道新田社*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 截图 电子 文档 识别 方法 系统 终端 介质
【说明书】:

发明公开了截图、电子文档的识别方法、系统、终端、介质,涉及计算机图像识别技术领域。信息数据处理终端获取图像的四个边中只要有一个边的边框处的某行或某列像素值完全等于其最邻近的某行或某列的像素值,则判定该获取的图像照片为目标图片,这里的目标图片指手机截图、电脑截图、电子文档。判定该获取的图像图片为目标图片后,如果该图片还存在EXIF信息,则再检测其EXIF信息,若没有曝光时间,则进一步认定该获取的图像照片为目标图片,并保存。本发明的方法在实际测试中精度超过95%,召回率85.3%,又快又好的实现了检测需求,本发明以一种简单的方法,解决现有技术存在的各种复杂情况。

技术领域

本发明涉及计算机图像识别技术领域,尤其涉及一种图像截图、电子文档的识别方法、系统、终端、介质。

背景技术

目前可参考的技术有频域分析、谱分析、滤波等传统图像处理技术,也可以参考拍摄图片的EXIF信息(如果图片是非拍摄的就没有该信息)。图片的EXIF是指:可交换图像文件格式,英文:Exchangeable image file format。如果EXIF信息完整,比如有曝光时间('ExposureTime')则认为其是摄像头直接拍摄的,为非目标图片,这里不考虑数字图片的拷贝问题,因为数字图片只要是拷贝则新拷贝的图片就与原图片是完全一致的,但本技术只是针对其中手机截图、电脑截图、电子文档的识别。

通过上述分析,现有技术存在的问题及缺陷为:

为识别一般图片与手机截图、电脑截图、电子文档,尝试过以下四种现有技术:

(1)使用传统的图像处理技术,如谱分析、滤波等,利用Fourier变换将问题转化到频域上分析,因为检测图片具有复杂多样性,使其在频域上很难找到一种稳定的特征供我们检测。

(2)对原始图片,使用目前流行的深度学习模型—卷积神经网络(CNN)分类的方法进行训练,预测效果也不行,原因也是因为检测图片具有复杂多样性。

(3)对原始图片,研究其RGB分布规律,进行统计分析,效果也很差。

(4)EXIF信息很容易因为数据格式间的转换,不同设备间的传输而破坏,实际中很难具有通用性。

解决以上问题及缺陷的难度为:要检测的图片具有复杂多样性,使其无论在原始空间域上采用图片分类模型(CNN)或研究其RGB分布规律,还是在频域使用谱分析、滤波等传统技术手段都不具有可行性。

解决以上问题及缺陷的意义为:本算法绕开了以上问题,发明了一种新的基于像素点检测的算法,可以简单、准确、快速的对手机截图、电脑截图、电子文档进行识别。

发明内容

为克服相关技术中存在的问题,本发明公开实施例提供了一种对图像截图、电子文档的识别方法、系统、终端、介质。尤其涉及一种基于像素点检测的对手机截图、电脑截图、电子文档的识别方法,所述技术方案如下:

根据本发明公开实施例的第一方面,提供一种基于像素点检测的对手机截图、电脑截图、电子文档的识别方法,应用于信息数据处理终端,所述基于像素点检测的对手机截图、电脑截图、电子文档的识别方法包括:

所述信息数据处理终端获取的图像的四个边中只要有一个边的边框处的某行或某列像素值完全等于其最邻近的某行或某列的像素值,则判定该图片不是在正常情况下拍摄的。原因在于即便在一个很亮或很暗的环境中,拍摄出的照片一行或一列会包含上千个像素点,其与最邻近行或列的像素点值完全相等,这在实际拍摄成像中几乎是不可能事件。

其中,为了确保准确,在判断条件之后再检测一下图片的EXIF信息(没有则跳过该步骤直接输出上一步判定结果,并保存),如果没有曝光时间('ExposureTime')这个属性的话,则进一步认定其为目标图片,将其保存起来。

所述信息数据处理终端包括:手机、电脑、摄像头或能获取图像信息的智能拍摄设备。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市网联安瑞网络科技有限公司,未经深圳市网联安瑞网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110315489.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top