[发明专利]一种适用于失信单位的实时识别及预警方法有效
申请号: | 202110496315.X | 申请日: | 2021-05-07 |
公开(公告)号: | CN112988762B | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 聂伟;何晓军;周华翰 | 申请(专利权)人: | 江苏中辰软件科技有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/242;G06F16/906;G06F16/951;G06F40/289;G06F40/18;H04L29/06 |
代理公司: | 南京禹为知识产权代理事务所(特殊普通合伙) 32272 | 代理人: | 王晓东 |
地址: | 211106 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 适用于 失信 单位 实时 识别 预警 方法 | ||
1.一种适用于失信单位的实时识别及预警方法,其特性在于,包括:
收集并归档现有的失信单位黑名单数据,基于所述失信单位黑名单数据建立黑名单源数据库;
利用网络嗅探器,将网卡置于混杂模式,通过所述网络嗅探器接收通过所述网卡的所有数据;
基于七层模型中的传输层和网络层,对所述接收到的所有数据进行实时抓取分类,筛选出TCP/IP协议报文,根据所述TCP/IP协议报文的不同属性分层存储于所述网卡中;
所述实时抓取分类的过程包括,
获取抓取信息端的抓取任务信息,即抓取所述TCP/IP协议报文;
根据所述抓取任务信息建立抓取分类模型;
所述抓取分类模型的建立包括,
获取规则数据信息,建立抓取任务规则,所述规则数据信息包括相关编码;
遍历所述接收到的数据,基于决策树策略分析得到数据信息特征节点,根据所述抓取任务规则对所述特征节点进行两次抓取并获得反例比例;
计算两次特征节点抓取的反例比例的比值;
若所述反例比例比值大于预设阈值,则抓取模型无效,重新遍历所述接收到的数据;
若所述反例比例比值小于或等于预设阈值,则所述抓取模型有效,对所述接收到的数据进行抓取及分类,得到所述TCP/IP协议报文;
基于所述抓取分类模型抓取分类所述接收到的数据得到所述TCP/IP协议报文;
所述根据所述TCP/IP协议报文的不同属性分层存储于所述网卡中包括,
所述TCP/IP协议报文按照不同属性分为三层,包括,
第一层包括固定首部长度在0~15字节之间,源端口在0~24525bits之间,目的端口范围与所述源端口范围相同;
第二层包括固定首部长度在16~28字节之间,源端口在24526~44578bits之间,目的端口范围与所述源端口范围相同;
第三层包括固定首部长度在29~40字节之间,源端口在44578~65525bits之间,目的端口范围与所述源端口范围相同;
基于分层属性与所述黑名单源数据库数据属性的相似度依次利用HTTP协议规范解析所述TCP/IP协议报文,并利用解码模型将中文编码转变为中文数据,利用N元文法模型对所述中文数据进行中文分词;
所述分层属性与所述黑名单源数据库数据属性的相似度评判标准包括,
相似度高:当所述黑名单源数据库数据字节数与分层属性中的字节数差值大于0小于等于5,且二者的bits比值大于0小于等于0.5;
相似度一般:当所述黑名单源数据库数据字节数与分层属性中的字节数差值大于6小于等于10,且二者的bits比值大于0.5小于等于1;
相似度低:当所述黑名单源数据库数据字节数与分层属性中的字节数差值大于11,且二者的bits比值大于1;
根据中文分词结果通过关键字检索查找对比所述黑名单源数据库是否存在黑名单内容,若存在所述黑名单内容,则进行弹框提示,并停止解析所述TCP/IP协议报文,完成失信单位的实时识别预警;
所述关键字检索查找对比过程包括,
读取储存在网卡中的不同分层属性的报文数据并按照相似度高低依次进行中文分词,即分层属性与所述黑名单源数据库数据属性相似度高的优先进行解析、解码并进行中文分词,利用所述中文分词结果进行关键词检索,若比对成功,则停止解析所述TCP/IP协议报文。
2.如权利要求1所述的适用于失信单位的实时识别及预警方法,其特征在于:所述黑名单源数据库的建立包括,
安装mysql5.7数据库用于源数据存储并创建所述数据库中的表excel;
根据失信单位的地区、名称、证件号以及未履行金额额度进行分类,生成所述源数据;
基于JAVA POI库显示所述源数据的excel导入导出,得到黑名单源数据库;
根据所述黑名单源数据库建立B+树结构的索引。
3.如权利要求2所述的适用于失信单位的实时识别及预警方法,其特征在于:所述基于HTTP协议规范解析所述TCP/IP协议报文得到HTTP报文的标准体,所述HTTP报文包括请求报文和响应报文;
解析所述请求报文得到请求行、请求头、请求体;
解析所述响应报文得到响应行、响应头、响应体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏中辰软件科技有限公司,未经江苏中辰软件科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110496315.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:PCIE桥片冗余主板、设计方法以及计算机存储介质
- 下一篇:船舶及其建造方法