[发明专利]指纹识别方法、设备和存储介质有效
| 申请号: | 201911180834.4 | 申请日: | 2019-11-27 |
| 公开(公告)号: | CN111061934B | 公开(公告)日: | 2023-04-07 |
| 发明(设计)人: | 陈毅聪;刘浩杰;李宇欣 | 申请(专利权)人: | 西安四叶草信息技术有限公司 |
| 主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/955;G06F16/958 |
| 代理公司: | 北京挺立专利事务所(普通合伙) 11265 | 代理人: | 韩畅 |
| 地址: | 710086 陕西省西安市高新区鱼化*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 指纹识别 方法 设备 存储 介质 | ||
本公开提供一种指纹识别方法、设备和存储介质,涉及网络安全领域,能够自动化进行指纹提取,提高指纹识别的准确度,降低人工成本。具体技术方案为:利用爬虫技术爬取流量后进行特征提取计算得到目标特征信息的权重值,对权重值进行提纯验证等操作,实现自动化指纹提取。本发明用于指纹识别。
技术领域
本公开涉及网络安全领域,尤其涉及指纹识别方法、设备和存储介质。
背景技术
在web渗透过程中,web指纹是信息收集中非常重要的一个环节。目前,大部分的指纹提取更多的是通过规则匹配或者技术人员自己的经验进行判断,规则匹配导致其指纹的准确性不高,而人工维护使得人力成本的大大增加。
发明内容
本公开实施例提供一种web指纹识别方法、设备和存储介质,能够自动化进行指纹提取,提高指纹识别的准确度,降低人工成本。所述技术方案如下:
根据本公开实施例的第一方面,提供一种指纹识别方法,该方法包括:
获取目标网页的网址信息,网址信息包括目标网页的URL;
通过网络爬虫对目标网页的网址信息进行爬取,获取目标网页的目标特征信息;
获取目标特征信息的目标权重;
在目标特征信息的目标权重满足预设条件时,将目标特征信息确定为目标网页的指纹信息。
本公开实施例利用爬虫技术爬取流量后进行特征提取计算得到目标特征信息的权重值,对权重值进行提纯验证等操作,实现自动化指纹提取,提高指纹的准确度,降低人工成本。
在一个实施例中,获取目标特征信息的目标权重包括:
根据目标特征信息和预设的目标特征库,获取目标特征信息的全局权重和应用权重;
根据目标特征信息的全局权重和应用权重,计算得到目标特征信息的目标权重。
在一个实施例中,根据目标特征信息和预设的目标特征库,获取目标特征信息的全局权重和应用权重包括:
判断目标特征库中是否包含目标特征信息;
在目标特征库中未包含目标特征信息时,将预设的初始全局权重确定为目标特征信息的全局权重,将预设的初始应用权重确定为目标特征信息的应用权重;
在目标特征库中包含目标特征信息时,将目标特征信息在目标特征库所占的比例确定为目标特征信息的全局权重,将在原始应用权重的基础上增加预设步长后确定为目标特征信息的应用权重,原始应用权重用于指示上一次目标特征信息的应用权重。
在一个实施例中,根据目标特征信息的全局权重和应用权重,计算得到目标特征信息的目标权重包括:
从目标特征库中获取与目标特征信息所关联的应用下所有特征信息的应用权重总和;
根据目标特征信息的应用权重M和与目标特征信息所关联的应用下所有特征信息的应用权重总和N,利用第一公式和第二公式计算得到第一参数TF和第二参数IDF;
根据第一参数TF、第二参数IDF和目标网页的全局权重P,利用第三公式计算得到目标特征信息的目标权重Q;
其中,第一公式为:TF=M/N,第二公式为:第三公式为:Q=TF*IDF/P。
在一个实施例中,在目标特征信息的目标权重满足预设条件时,将目标特征信息确定为目标网页的指纹信息包括:
对目标特征信息的目标权重进行归一化处理,得到归一化的目标权重;
判断归一化的目标权重是否达到预设阈值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安四叶草信息技术有限公司,未经西安四叶草信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911180834.4/2.html,转载请声明来源钻瓜专利网。





