[发明专利]一种基于机器学习技术进行物联网异常行为检测的方法有效
| 申请号: | 201910398517.3 | 申请日: | 2019-05-14 |
| 公开(公告)号: | CN110086829B | 公开(公告)日: | 2021-06-22 |
| 发明(设计)人: | 常清雪;江佳峻;龚致 | 申请(专利权)人: | 四川长虹电器股份有限公司 |
| 主分类号: | H04L29/06 | 分类号: | H04L29/06;G06N20/00 |
| 代理公司: | 四川省成都市天策商标专利事务所 51213 | 代理人: | 郭会 |
| 地址: | 621000 四*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 机器 学习 技术 进行 联网 异常 行为 检测 方法 | ||
1.一种基于机器学习技术进行物联网异常行为检测的方法,其特征在于,包括以下步骤:
A.搜集物联网协议数据;
B.对搜集到的数据进行特征处理,根据数据中的键值区分数据属于数值型还是字符型;若属于数值型则进入步骤C,若属于字符型则进入步骤D;
C.对属于数值型的数据进行周期性行为计算,并利用机器学习算法建模,预测异常数据;
具体包括:
C1.对属于数值型的数据进行特征增维;
C2.对增维后的数据进行傅里叶变换计算其周期性,并进行周期性检测;
C3.若存在周期性,则对数据进行时序性预测,如果实际值与预测结果超过阈值,则判定为异常,否则判定为正常;
C4.若不存在周期性,则对数据进行线性相关性预测,如果实际值与预测结果超过阈值,则判定为异常,否则判定为正常;
D.对属于字符型的数据进行分词处理判断字符熵,并进行机器学习算法建模,计算离群点从而区分异常数据;
具体包括:对属于字符型的数据进行n-gram分词,并进行熵计算,再根据熵的值判断字符串存在的规律,然后进行聚类计算离群点,从而识别异常数据。
2.根据权利要求1所述的一种基于机器学习技术进行物联网异常行为检测的方法,其特征在于,所述步骤A中搜集的物联网协议数据包括http协议数据、MQTT协议数据、XMPP协议数据。
3.根据权利要求1或2所述的一种基于机器学习技术进行物联网异常行为检测的方法,其特征在于,所述搜集物联网协议数据时具体是在物联网云端服务器流量出入口处进行搜集。
4.根据权利要求1或2所述的一种基于机器学习技术进行物联网异常行为检测的方法,其特征在于,所述搜集的物联网协议数据为流量数据或已经解析过的消息数据。
5.根据权利要求4所述的一种基于机器学习技术进行物联网异常行为检测的方法,其特征在于,若搜集的物联网协议数据为流量数据,则步骤A中还需对搜集的流量数据进行消息解析及还原。
6.根据权利要求1所述的一种基于机器学习技术进行物联网异常行为检测的方法,其特征在于,所述步骤B具体包括:
B1.对搜集到的数据按照统一的格式进行格式化处理;
B2.对格式化处理之后的数据中的键值进行区分,将数据分为数值型和字符型;
B3.若数据属于数值型则进入步骤C,若属于字符型则进入步骤D。
7.根据权利要求6所述的一种基于机器学习技术进行物联网异常行为检测的方法,其特征在于,所述格式化处理具体为:采用统一的json格式进行数据存储,其中,存储的数据内容包括协议名称,协议中的参数,其中,所述协议中的参数包含请求中的参数、协议中的指令类型、消息payload中的值。
8.根据权利要求1所述的一种基于机器学习技术进行物联网异常行为检测的方法,其特征在于,所述步骤C1中特征增维包括数值的平方,数值的熵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910398517.3/1.html,转载请声明来源钻瓜专利网。





