[发明专利]基于特征值比对的内容分析方法有效

专利信息
申请号: 200910209248.8 申请日: 2009-10-27
公开(公告)号: CN101699428A 公开(公告)日: 2010-04-28
发明(设计)人: 张明哲;徐克华;张保忠;刘灿雄 申请(专利权)人: 中华电信股份有限公司
主分类号: G06F17/27 分类号: G06F17/27;G06F17/22
代理公司: 广州华进联合专利商标代理有限公司 44224 代理人: 万志香;曾旻辉
地址: 中国台湾桃园县杨梅*** 国省代码: 中国台湾;71
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 特征值 内容 分析 方法
【权利要求书】:

1.一种基于特征值比对的内容分析方法,其特征在于:至少包括:

文件特征建构流程,将欲防护的机密文件利用文件特征建构功能,进行特征值的分区计算,并建构出相应的文件特征档案;

特征值加载流程,将各区特征值加载至所属的数据结构中;

文件特征比对流程,利用文件特征比对功能将加载的文件特征数据向目标文件进行指定长度的数据内容比对,以判断文件是否包含机密数据;

所述文件特征建构流程,处理步骤包括:

a.设定数据的读取终点;

b.循序读取机密文件的内容,排除空格符、组成一个固定长度的数据区块;

c.计算数据区块的字码统计值;

d.利用杂凑算法计算数据区块的特征值;

e.依据字码统计值将特征值写至不同的特征档案;

f.重置字码统计值,并设定下一个读取位置;

g.重复步骤b.至f.,直至读取终点才结束;

所述文件特征比对流程,处理步骤包括:

a.设定目标文件的读取终点;

b.依据目标文件的长度设定数据重迭参数;

c.循序读取目标文件的内容;

d.排除空格符、组成一个固定长度的数据区块;

e.计算数据区块的字码统计值;

f.利用杂凑算法计算数据区块的特征值;

g.依据e.计算得到的字码统计值设定所属的特征数据比对区及其终点;

h.特征值的分区循序比对,以判断文件是否包含机密数据;

i.重置字码统计值,并依数据重迭参数设定下一个读取位置;

j.重复步骤c.至i.,直至读取终点或发现机密数据才结束。

2.如权利要求1所述的基于特征值比对的内容分析方法,其特征在于:所述特征档案是在中文码范围采取较细的切割而英文码范围采取较宽的切割而划分的。

3.如权利要求1所述的基于特征值比对的内容分析方法,其特征在于:所述字码统计值的计算,其处理步骤包括:

a.排除空格符、组成一个固定长度的数据区块;

b.依据字符的内码值范围对字码统计值进行累计运算;

c.于文件特征建构阶段依据字码统计值将特征值分区写至所属档案;

d.于文件特征比对阶段依据字码统计值分区比对特征值。

4.如权利要求3所述的基于特征值比对的内容分析方法,其特征在于:所述内码值范围基于中/英文字码分布的范围而选定。

5.如权利要求1所述的基于特征值比对的内容分析方法,其特征在于:所述数据重迭参数在目标文件长度小于某一内定值时采用最大的重迭参数值,以便在不影响系统效能的状况下进行最精确的比对作业。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中华电信股份有限公司,未经中华电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200910209248.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top