[发明专利]一种基于KDTree的图像数据库数据处理方法有效
| 申请号: | 202110139298.4 | 申请日: | 2021-02-02 |
| 公开(公告)号: | CN112463804B | 公开(公告)日: | 2021-06-15 |
| 发明(设计)人: | 王浩;秦拯;陈嘉欣;欧露 | 申请(专利权)人: | 湖南大学 |
| 主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/29;G06F21/57;G06F21/62;G06F40/289 |
| 代理公司: | 深圳市兴科达知识产权代理有限公司 44260 | 代理人: | 殷瑜 |
| 地址: | 410082 湖*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 kdtree 图像 数据库 数据处理 方法 | ||
本发明公开了一种基于KDTree的图像数据库数据处理方法,包括如下步骤:步骤一、基于KDTree对地图标注信息进行遍历和整合,得到标注集S={s1,s2,…,sn};步骤二、对标注集S进行基于词语相似度的敏感信息检测,将地图标注内容进行敏感度分级;步骤三、根据地图标注内容的敏感度等级进行对应的脱敏处理。本发明利用了地图标注的位置信息,实现了对地理空间数据中标注内容的遍历、整合和敏感信息脱敏的自动处理,克服了现有人工处理下工作繁琐,效率低下且容易出错以及出现漏洞的现象。
技术领域
本发明涉及地理信息数据处理领域,尤其涉及一种基于KDTree的图像数据库数据处理方法。
背景技术
近年来,计算机技术的迅猛发展推动了地理信息系统技术的发展与进步。地理信息系统(Geographic Information System,GIS)涉及地理学、测绘学、计算机科学与技术等多个学科,以计算机为工具,将地理空间数据作为研究对象,把地图这一独特的可视化效果和地理分析功能与数据库操作集成在一起,为地理、规划与管理等许多行业和部门提供决策信息。
目前,随着移动互联网的发展,人们日常出行时对基于地理信息的服务需求不断增加。各类电子地图的广泛应用,在给人们工作、生活提供便利的同时,也带来不少安全隐患问题。其中,地图标注信息安全保护是值得研究的一个问题。地图标注信息中可能包含一些敏感内容,比如国家战略资源、军事禁地、国防设施等。对此,国家出台了多项法律规定和政策,如《公开地图内容表示补充规定(试行)》、《基础地理信息公开表示内容的规定(试行)》等,明确规定了公开地图中能表示和不能表示的内容,从法律政策层面加强了地理信息安全保护工作。目前各机构单位采用了内网隔离的技术手段以保障数据安全,并要求在将地理信息发布至外网之前,需要对内网中的敏感数据进行脱敏处理。
在现实场景中,地图上的标注内容以属性表的形式保存,为使得表达效果美观、完整,部分标注由多个单字构成,如属性表中用多条由单字构成的记录来表示一个地名,当在地图上搜索关键字时容易遗漏部分标注内容。在该情况下,现存的脱敏处理工作不得不依赖于人工检查地图中每个区域的标注内容,对此进行审核识别和处理,这种方式仍存在内容遗漏问题,且市级以上的地图区域庞大、内容复杂,人工处理工作繁琐,效率低下。因此,迫切需要研究一种基于计算机技术整合地图中的标注信息并进行脱敏处理的方法,这对维护地理信息安全具有重要意义。
对由多个单字构成的标注内容,常见的划分方法为词法分析,即将字符序列转换为单词序列,把接收到的一串连续的字符切分成单个的词,再将得到的词与敏感词库进行匹配,进而检测出敏感信息。然而,当对标注包含的多个单字执行常规的增加、删除或修改操作,可能导致这些单字在属性表中乱序、重复排列,仅采用简单的分词无法处理该情况。
虽然标注内容在属性表中的排列不规则,但在地图中每个字符均关联一个位置坐标,待整合的标注字段在位置分布上有很强的相关性,如排列更紧密、从上至下、从左至右、几乎分布在一条直线上等。本发明利用了地图标注的位置信息,实现了对地理空间数据中标注内容的遍历、整合和敏感信息脱敏处理。
名词解释:KDTree(k-dimensional树):是一种对k维空间中的实例点进行存储以便对其进行快速检索的树形数据结构。
jieba分词:一款非常流行中文开源分词包,具有高性能、准确率、可扩展性等特点,目前主要支持python,其它语言也有相关版本。
word2vec:是一群用来产生词向量的相关模型。这些模型为浅而双层的神经网络,用来训练以重新建构语言学之词文本。网络以词表现,并且需猜测相邻位置的输入词,在word2vec中词袋模型假设下,词的顺序是不重要的。训练完成之后,word2vec模型可用来映射每个词到一个向量,可用来表示词对词之间的关系,该向量为神经网络之隐藏层。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110139298.4/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





