[发明专利]一种工业物联网的稀疏协议解析系统在审
申请号: | 202010992331.3 | 申请日: | 2020-09-21 |
公开(公告)号: | CN112134878A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 何云华;肖珂;张翠;王超 | 申请(专利权)人: | 北方工业大学 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;H04L29/08 |
代理公司: | 北京科石知识产权代理有限公司 11595 | 代理人: | 徐红岗 |
地址: | 100041 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 工业 联网 稀疏 协议 解析 系统 | ||
1.一种工业物联网的稀疏协议解析系统,包括:
数据预处理模块:对工业物联网中的通信数据进行过滤,丢弃异常数据,对正常数据集解封装、提取;
数据扩充模块:解决在相对私有的工业物联网环境中获取数据量较少,难以用于分析的问题,使用遗传算法对数据预处理模块捕获的工业物联网初始报文序列样本集进行扩充;
参数训练模块:将扩充的工业物联网协议数据样本训练集输入到隐马尔可夫模型中,对隐马尔可夫模型的参数进行训练,更新;
协议格式预测模块:通过估计工业物联网协议序列的最大似然概率,预测最优的协议报文格式。
2.一种工业物联网的稀疏协议解析方法,包括:
S1:数据预处理:对捕获的工业物联网中的通信数据包进行过滤,丢弃丢包、重传和乱序的异常数据,并对正常数据集解封装、提取,得到完整的工业物联网应用层报文,作为初始报文序列样本集;
S2:数据扩充:通过遗传算法来扩充数据预处理流程中捕获的工业物联网初始报文序列样本集,首先,通过聚类提取相同类型的工业物联网协议消息序列;其次,将样本序列通过交叉、变异等操作生成新的数据;然后,根据协议报文响应数据设计适应度函数来评估生成样本的优劣;最后,扩充出一些高质量的样本,并将其分为训练集和测试集;
S3:参数训练:将步骤S2得到的扩充工业物联网协议数据训练集输入到隐马尔可夫模型中,然后通过期望最大化算法,对隐马尔可夫模型的参数进行训练,更新;
S4:协议格式预测:将训练好的模型通过维特比算法来估计最大似然概率的隐状态序列,即得到最优的工业物联网协议报文格式。
3.如权利要求2所述的一种工业物联网的稀疏协议解析方法,其中,步骤S3中的所述期望最大化算法的具体包括:
S31:参数设置:将模型的参数表示为λ={Aij,πi,Bj(k)},将Aij视为等概率分布,将初始概率分布πi设置为(1,0,0,...0)T,并随机选择初始发射概率为Bj(k),步骤S2得到的扩充工业物联网数据训练集作为观测序列,记为O=(o1,o2,o3,...oT),工业物联网协议字段作为隐藏状态序列,记为I=(i1,i2,i3,...iT);
S32:E步:根据当前估计值λ,计算模型中隐变量的期望值,作为隐变量的估计值其中,λ为要极大化的隐马尔可夫参数,为隐马尔可夫模型参数的当前估计值;
S33:M步:极大化Q函数来计算模型参数λ={Aij,πi,Bj(k)},得到模型参数并将找到的新参数用于步骤32的计算,重复步骤32、33过程,直到参数收敛,得到最终的隐马尔可夫模型参数。
4.如权利要求2所述的一种工业物联网的稀疏协议解析方法,其中,步骤S4中的所述维特比算法具体包括:
S41:输入隐马尔可夫模型参数λ={Aij,πi,Bj(k)}以及扩充的工业物联网数据训练集组成的观测序列O=(o1,o2,o3,...oT)引入变量δ,Ψ,并定义在t时刻状态为i的所有单个路径(i1,i2...it)中最大似然概率为δt(i),在时刻t状态为i的所有单个路径(i1,i2...it)中概率最大的第t-1个节点为Ψt(i),并初始化δ1(i)=πibi(o1),Ψ1(i)=0;
S42:当t=2,3,...T时,对于状态i,计算δt(i)的递推式
S43:计算在时刻t状态为i的所有单个路径中概率最大的路径的第t-1个结点为
S44:当I1=jn时,算法终止,计算出最大似然概率的隐状态序列{jn,jn-1,...j1},即得到未知的工业物联网协议报文格式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北方工业大学,未经北方工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010992331.3/1.html,转载请声明来源钻瓜专利网。