[发明专利]取证数据解析准确性的智能校验方法和系统有效

专利信息
申请号: 201810425900.9 申请日: 2018-05-07
公开(公告)号: CN108629012B 公开(公告)日: 2020-08-25
发明(设计)人: 陈碧秀;吴高峰;江汉祥;施剑朕;吴神培;连洲红 申请(专利权)人: 厦门市美亚柏科信息股份有限公司
主分类号: G06F16/84 分类号: G06F16/84;G06F16/23
代理公司: 厦门福贝知识产权代理事务所(普通合伙) 35235 代理人: 郝学江
地址: 361000 福建省厦门市*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 取证 数据 解析 准确性 智能 校验 方法 系统
【说明书】:

发明公开了一种取证数据解析准确性的智能校验方法,该方法通过遍历并提取行业标准中的所有字段信息,并以一定的规则整合到文件中,从而实现了校验技术的智能化,大大节约了人力资源成本、提高了校验效率,同时能有效地避免因为人工干预所造成的一些主观因素和视觉疲劳所导致的失误,改善了数据的可靠性。本发明还公开了一种取证数据解析准确性的智能校验系统,可实现前述的取证数据解析准确性的智能校验方法。

技术领域

本发明涉及信息技术领域,并且特别涉及一种取证数据解析准确性的智能校验方法和系统。

背景技术

随着社会流动性以及个人交际圈的扩大,个体所拥有的身份信息量增加,再加上人与人之间的关联性进一步提高,以及存储技术和计算机网络通信技术的发展,计算机网络中每天产生的数据庞大而复杂,取证产生的数据也趋于庞大,由原先的几百上千到现在的百亿大关。

数据量的迅猛增长导致取证分析领域的数据比对越发困难,再加上取证标准和取证格式的多样化,使得取证数据比对的难度增加,原先的手工检测基本上难以完成。此外,由于取证分析领域属于新的领域,市面上没有类似的工具和方法。因此,取证相关的检测人员只能不断重复地埋头比对数据,效率低、会造成视觉疲劳、容易出错且周期耗费过长,难以满足取证分析领域的产品和技术的快速更新迭代的需求。

在目前的取证分析实践中,发现了以下三个现象:

(一)以XML和BCP格式生成的取证数据包经过逐层数据清洗后,在各类取证分析平台中的展示呈现分散的状态,表与表之间并非一一对应,部分字段名称和值均经过转译,增加比对的困难。

(二)取证数据量大,一个取证数据包中往往有数十甚至数百张表,而一个系统中又拥有数十甚至数百万的取证数据包,如何检测取证数据包在传输、解析以及清洗的过程中的数据正确性,采用人工比对明显很困难。

(三)取证分析平台所对接的取证设备呈现多样化的趋势,不同生产厂商所采用的行业标准也不一致,不同取证设备所生成的取证数据包存在或多或少的差异。

发明内容

针对上述问题,本发明提出了一种取证数据解析准确性的智能校验方法和系统,实现了校验技术的智能化,大大节约了人力资源成本、提高了校验效率,同时能有效地避免因为人工干预所造成的一些主观因素和视觉疲劳所导致的失误,改善了数据的可靠性。

在一个方面,提出了一种取证数据解析准确性的智能校验方法,其包括:在数据库中建立原始数据与HTML数据的映射关系表,并配置该原始数据与入库数据的映射关系;从目标取证分析平台取得需要核对的所有原始数据包以建立文件集合,遍历该文件集合以取得第一个数据包的文件名,并根据该文件名拷贝对应的文件到本地目录;根据该文件名从该目标取证分析平台找到文件页面展示数据所对应的HTML数据结构,遍历该HTML数据结构以取得列表数据集合并以特定存储格式进行本地保存;解压缩该原始数据包以取得全部原始数据文件集合,遍历该原始数据文件集合并通过IO流逐个读取并按属性与值对应的格式保存到本地;以及以特定存储格式对该原始数据文件集合进行转译和存储,从该原始数据文件集合中获取第一个原始数据文件,根据配置关系找到对应的HTML数据文件,分别读取该原始数据文件和该HTML数据文件到该列表数据集合中,根据配置关系表找到对应字段的映射索引关系的集合并据以执行数据字符串的相同性比较。

在一些具体实施例中,取得该目标取证分析平台的HTML结构数据,以及遍历该HTML数据结构并逐层寻找展示数据,使用通用定位条件取得存放数据的表,遍历该存放数据的表以取得所有的该展示数据并进行分页保存。

在一些具体实施例中,遍历该原始数据文件和该HTML数据文件,根据该配置关系找到该原始数据文件对应的该HTML数据文件,根据该原始数据与界面数据的映射关系找到对应的映射字段并执行字符串的比较,而后将比较结果保存到该列表数据集合中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门市美亚柏科信息股份有限公司,未经厦门市美亚柏科信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810425900.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top