[发明专利]异常报文分类方法、装置、计算机设备和存储介质在审
| 申请号: | 202010171857.5 | 申请日: | 2020-03-12 |
| 公开(公告)号: | CN111460802A | 公开(公告)日: | 2020-07-28 |
| 发明(设计)人: | 吴宏平;贺勇军 | 申请(专利权)人: | 微民保险代理有限公司 |
| 主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/289;G06F16/35;G06Q40/08 |
| 代理公司: | 深圳智汇远见知识产权代理有限公司 44481 | 代理人: | 李雪鹃 |
| 地址: | 518063 广东省深圳市南山区*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 异常 报文 分类 方法 装置 计算机 设备 存储 介质 | ||
1.一种异常报文分类方法,其特征在于,所述方法包括:
获取异常报文;
根据标签库,对所述异常报文设置标签;
根据所述异常报文的标签和分词库,对所述异常报文进行语句分词;
根据语句分词结果,获取多个所述异常报文之间的相似性;
使相似的所述异常报文进入相同的分桶,不相似的所述报文进入不相同的分桶;
其中,所述标签库和分词库根据报文属性更新,所述报文属性包括:报文对应的平台服务器、报文对应的协议、报文对应的接口、报文对应的地区。
2.如权利要求1所述的方法,其特征在于,所述获取异常报文,包括:
从各个平台服务器获取报文,
根据所述报文的状态码,判断所述报文的状态,以获取异常报文,所述报文的状态包括正常或异常。
3.如权利要求1所述的方法,其特征在于,所述根据标签库,对异常报文设置标签,包括:
获取所述异常报文的关键字;
根据所述标签库和所述异常报文的关键字,设置所述异常报文的标签。
4.如权利要求3所述的方法,其特征在于,每个所述标签对应预设的分数值;
所述根据异常报文的标签和分词库,对所述异常报文进行语句分词,包括:
获取所述异常报文的总分值,所述异常报文的总分值为所述异常报文包括的所有标签的分数值的总和;
判断所述异常报文的总分值是否大于等于分数阈值;
若所述异常报文的总分值大于等于所述分数阈值,则将所述异常报文放入第一分桶,
若所述异常报文的总分值小于所述分数阈值,则根据预设规则库,对所述异常报文进行过滤清洗,获取多个特征词。
5.如权利要求4所述的方法,其特征在于,所述对异常报文进行过滤清洗,获取多个特征词,包括:
根据所述分词库,判断所述异常报文是否包含特定特征词;
若所述异常报文包含特定特征词,则将所述特定特征词取出后,进行一般规则清洗,获取多个一般特征词,
若所述报文不包含所述特定特征词,则将所述报文进行一般规则清洗,获取多个一般特征词。
6.如权利要求5所述的方法,其特征在于,所述获取多个异常报文之间的相似性,包括:
对所述特征词进行降维处理,获得特征词的特征值;
对所述特征词的特征值加权处理,累计分数后得到签名值;
根据所述签名值,计算多个所述异常报文之间的距离;
若两个所述异常报文之间的距离大于等于距离阈值,则确认所述异常报文相似,
若两个所述异常报文之间的距离小于所述距离阈值,则确认所述异常报文不相似;
其中,所述特征词为一般特征词,或为一般特征词和特定特征词。
7.如权利要求1所述的方法,其特征在于,在所述获取多个异常报文的相似性之后,在所述使相似的异常报文进入相同的分桶之前,所述方法还包括:
将多个相似报文中的任一一条相似报文与多个历史分桶中的历史报文进行相似性判定;
若所述相似报文与所述历史报文相似,则使所述多个相似报文进入对应的历史分桶;
若所述相似报文与所有历史报文不相似,则新建分桶,使所述多个相似报文进入所述新建分桶。
8.如权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述报文属性,调整所述标签库和/或分词库;和/或,
根据历史分桶,调整所述标签库和/或分词库。
9.如权利要求6所述的方法,其特征在于,所述方法还包括:
根据所述报文属性,调整所述分数阈值和/或距离阈值;和/或
根据历史分桶,调整所述分数阈值和/或距离阈值。
10.如权利要求7所述的方法,其特征在于,所述第一分桶为历史分桶中所述总分值大于等于所述分数阈值的异常报文进入的分桶。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微民保险代理有限公司,未经微民保险代理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010171857.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:火情监控系统及火情监控方法
- 下一篇:码率控制方法、装置及可读存储介质





