[发明专利]基于特征值比对的内容分析方法有效
| 申请号: | 200910209248.8 | 申请日: | 2009-10-27 |
| 公开(公告)号: | CN101699428A | 公开(公告)日: | 2010-04-28 |
| 发明(设计)人: | 张明哲;徐克华;张保忠;刘灿雄 | 申请(专利权)人: | 中华电信股份有限公司 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/22 |
| 代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 万志香;曾旻辉 |
| 地址: | 中国台湾桃园县杨梅*** | 国省代码: | 中国台湾;71 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 特征值 内容 分析 方法 | ||
1.一种基于特征值比对的内容分析方法,其特征在于:至少包括:
文件特征建构流程,将欲防护的机密文件利用文件特征建构功能,进行特征值的分区计算,并建构出相应的文件特征档案;
特征值加载流程,将各区特征值加载至所属的数据结构中;
文件特征比对流程,利用文件特征比对功能将加载的文件特征数据向目标文件进行指定长度的数据内容比对,以判断文件是否包含机密数据;
所述文件特征建构流程,处理步骤包括:
a.设定数据的读取终点;
b.循序读取机密文件的内容,排除空格符、组成一个固定长度的数据区块;
c.计算数据区块的字码统计值;
d.利用杂凑算法计算数据区块的特征值;
e.依据字码统计值将特征值写至不同的特征档案;
f.重置字码统计值,并设定下一个读取位置;
g.重复步骤b.至f.,直至读取终点才结束;
所述文件特征比对流程,处理步骤包括:
a.设定目标文件的读取终点;
b.依据目标文件的长度设定数据重迭参数;
c.循序读取目标文件的内容;
d.排除空格符、组成一个固定长度的数据区块;
e.计算数据区块的字码统计值;
f.利用杂凑算法计算数据区块的特征值;
g.依据e.计算得到的字码统计值设定所属的特征数据比对区及其终点;
h.特征值的分区循序比对,以判断文件是否包含机密数据;
i.重置字码统计值,并依数据重迭参数设定下一个读取位置;
j.重复步骤c.至i.,直至读取终点或发现机密数据才结束。
2.如权利要求1所述的基于特征值比对的内容分析方法,其特征在于:所述特征档案是在中文码范围采取较细的切割而英文码范围采取较宽的切割而划分的。
3.如权利要求1所述的基于特征值比对的内容分析方法,其特征在于:所述字码统计值的计算,其处理步骤包括:
a.排除空格符、组成一个固定长度的数据区块;
b.依据字符的内码值范围对字码统计值进行累计运算;
c.于文件特征建构阶段依据字码统计值将特征值分区写至所属档案;
d.于文件特征比对阶段依据字码统计值分区比对特征值。
4.如权利要求3所述的基于特征值比对的内容分析方法,其特征在于:所述内码值范围基于中/英文字码分布的范围而选定。
5.如权利要求1所述的基于特征值比对的内容分析方法,其特征在于:所述数据重迭参数在目标文件长度小于某一内定值时采用最大的重迭参数值,以便在不影响系统效能的状况下进行最精确的比对作业。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中华电信股份有限公司,未经中华电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910209248.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种带照明装置的淋浴房
- 下一篇:轻型液压支架的垂直导杆连接机构
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法





