[发明专利]一种涉密电子文件定解密方法在审
申请号: | 202110709394.8 | 申请日: | 2021-06-25 |
公开(公告)号: | CN113486191A | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 王坤龙;田宗凯;宋颖毅;杨雨婷;韩富英 | 申请(专利权)人: | 北京计算机技术及应用研究所 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/335;G06F16/35;G06F40/14;G06F40/211;G06F40/30 |
代理公司: | 中国兵器工业集团公司专利中心 11011 | 代理人: | 辛海明 |
地址: | 100854*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 密电 文件 解密 方法 | ||
本发明涉及一种涉密电子文件定解密方法,属于文件定解密领域。本发明包括如下步骤:S1、涉密电子文件密点分析与样本收集;S2、基于信息增益的密点关键词挖掘;S3、基于知识图谱的密点关联规则库构建;S4融合军工密点规则集的知识图谱构建;S5、智能匹配对比与快速定解密。本发明通过智能化分析技术,加强涉密电子文件定解密工作的准确化、规范化;利用电子文件密点动态追踪手段,提升电子文件密级解除工作的及时性、准确性和智能性;通过密点比对和基于语义分析的智能匹配技术,实现涉密电子文件密级的实时确定、智能化变更和及时解密。
技术领域
本发明属于文件定解密领域,具体涉及一种涉密电子文件定解密方法。
背景技术
军工涉密网目前在国家的涉密单位中有大范围的使用,虽然大多数与广域网之间进行了物理隔绝,但仍存在有高密低传,或者高密底存等现象。目前,存在一些可在某些军工涉密网中应用的监控方法,北交大也有学者做相关工作,航天四院也有基于关键词的密点挖掘工具,能够基于关键词匹配的方式进行密点挖掘,为涉密电子文件定解密提供支撑。
现有的密点监控技术大部分都基于关键词匹配进行密点挖掘,多只针对单个密点,未考虑密点之间的关联性。目前,存在的一些可基于关键词的密点挖掘工具,但无法做关联挖掘。此外,密点广泛存在与新闻宣传稿件中,使用单个关键词匹配存在密点泛化的问题,且误报率较高,人工确认工作量大。
发明内容
(一)要解决的技术问题
本发明要解决的技术问题是如何提供一种涉密电子文件定解密方法,以解决现有技术中存在的涉密信息定密不准、密点泛化、解密不规范问题。
(二)技术方案
为了解决上述技术问题,本发明提出一种涉密电子文件定解密方法,该方法包括如下步骤:
S1、涉密电子文件密点分析与样本收集;
开展涉密电子文件密点分析与样本收集,形成多源涉密电子文件样本库;
S2、基于信息增益的密点关键词挖掘;
以多源涉密电子文件样本库作为数据集输入,引入信息增益技术对密点关键词进行挖掘分析,获得不同关键词的信息增益,根据信息增益阈值实现无效或低效密点关键词的过滤;
S3、基于知识图谱的密点关联规则库构建;
以步骤S2获得的密点关键词为基础,利用Apriori算法分析挖掘不同个数的密点关键词相互出现时对密级的影响关系,记为密点关联规则;
S4融合军工密点规则集的知识图谱构建;
借助知识图谱RDF存储方法,将密点关联规则集合统一存储于知识图谱;
S5、智能匹配对比与快速定解密;
将包含候选密点的短文本电子文件转换为RDF数据模型,进而与密点规则知识图谱开展匹配对比,确定电子文件的密级。
进一步地,所述步骤S1具体包括如下步骤:
S11、进行涉密电子文件的特点分析,确定定解密流程,根据定密原则和解密原则分析涉密电子文件的特征,形成一套定解密的指导原则;
S12、使用定解密的指导原则指导多源涉密知识数据的加工与整合,对涉密电子文件进行属性分析,对密级属性进行划分,以此作为研究基础和依据,开展电子文件的整合,分别对项目类文件和综合管理类文件进行收集与分类;
S13、针对整合后的电子文件,开展涉密信息的提取,最终形成多源涉密电子文件样本库。
进一步地,所述步骤S2具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京计算机技术及应用研究所,未经北京计算机技术及应用研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110709394.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种三氯化铁污渍的清洗方法
- 下一篇:一种富锶奶茶及其制作方法