[发明专利]一种暗网电子数据提取固定方法在审
申请号: | 202110399112.9 | 申请日: | 2021-04-14 |
公开(公告)号: | CN113032655A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 汤艳君;安俊霖;明泰龙;刘丛睿;张一鸣;刘俊泽 | 申请(专利权)人: | 中国刑事警察学院 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/955 |
代理公司: | 沈阳优普达知识产权代理事务所(特殊普通合伙) 21234 | 代理人: | 陈曦 |
地址: | 110854 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电子 数据 提取 固定 方法 | ||
本发明为提供一种暗网电子数据提取固定方法。通过网络爬虫技术对暗网网页数据和交易数据进行提取固定,并计算电子数据的完整性校验值,最终将结果以可视化的形式呈现在暗网在线取证系统前端。实现了基于Tor的暗网违法商城的网页爬取及网站中违法交易文本信息提取固定,将所爬取的线索或证据文件存储至数据库中,并能以可视化形式呈现予办案人员,整个爬取及固定过程不影响暗网网站的正常运行,具有较高的准确性和隐蔽性,为涉暗网案件提供行之有效的取证方法。这样不仅能极大减轻了侦查人员的人工操作,也能提高日常工作效率。
技术领域
本发明属于电子数据取证技术领域,涉及一种暗网电子数据提取固定方法。
背景技术
暗网的匿名性使得用户个人信息不易查明;通信内容难以监管,暗网因此成为了犯罪人员从事危害社会和国家安全活动的集聚地,其中的非法交易数量巨大且内容涉及众多领域,常见的交易内容包含公民个人信息、毒品毒物等等,对社会治安造成严重危害,打击暗网犯罪刻不容缓。
随着暗网的发展,暗网中涉及非法网站类案件数量也将直线上升,犯罪事实不限于公民信息交易,案情复杂难以分析,而且面对页面较多的非法网站时,繁琐的截屏录像取证成为公安机关办案民警的一大难题。办案人员针对暗网取证,存在的难点主要有以下几点:(1)暗网的大量违法网站生命周期很短;(2)犯罪分子在实施犯罪后,会快速删除网络犯罪痕迹;(3)如何保存和管理繁杂、海量的暗网网站数据;(4)在打击境内暗网犯罪刚刚起步的当下,缺乏专门针对暗网的市场化取证产品。
发明内容
为解决上述技术问题,本发明提供一种暗网网站爬取及交易信息文本固定方法,通过网络爬虫技术对暗网网页数据和交易数据进行提取固定,并计算电子数据的完整性校验值,最终将结果以可视化的形式呈现在暗网在线取证系统前端。
本发明提供一种暗网电子数据提取固定方法,包括:
步骤1、编写暗网网站爬虫,利用浏览器测试框架进行暗网网站爬取;
步骤2、暗网网站交易文本信息固定;
步骤3、取证结果的可视化呈现。
在本发明的暗网电子数据提取固定方法中,所述暗网网站的域名地址的获取包括以下方法:
(1)Google语法搜索:利用Google语法进行搜索,获取与暗网域名相关的百度结果链接,并保存在本地txt文档中;
(2)正则表达式:根据Tor网络域名的形式,通过正则表达式收集域名地址,并使用以下URL的正则表达式进行匹配:
^https?:\/\/(([a-z0-9_-]{1,64}\.){0,4}[a-z0-9=]{16}\.onion)(:|\/|$)
从而获得相应的Tor网址,存储在本地txt文档并持续更新.将上述方法所收集的Tor域名地址,保存至urls.txt中。
在本发明的暗网电子数据提取固定方法中,所述步骤1中利用浏览器测试框架进行暗网网站爬取具体为:针对暗网的网站结构,暗网爬虫利用Selenium自动化测试框架进行爬取,Selenium测试直接运行在浏览器中,支持自动录制动作和自动生成.Net、Java、Perl不同语言的测试脚本。
在本发明的暗网电子数据提取固定方法中,所述步骤1中暗网网页爬取具体为:
步骤1.1:网页搜索:先利用Selenium访问用户输入的目标网址,随后根据用户提供的地址进行网页搜索,网页搜索步骤采用广度优先算法进行遍历,先将输入的主网站的域名作为入口,以主网站为第一层节点,然后爬取位于第二层的所有节点,层层爬行,直至未爬取队列为空或者达到设定的层次提取出未访问过的待爬取的URL列表;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国刑事警察学院,未经中国刑事警察学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110399112.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种一体化组合式光源
- 下一篇:折叠晾衣架
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置