[发明专利]一种基于SOINN网络的在线物联网设备识别方法在审
申请号: | 202110781214.7 | 申请日: | 2021-07-10 |
公开(公告)号: | CN113657443A | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 黄杰;张帅帅 | 申请(专利权)人: | 东南大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G16Y30/00 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 杜静静 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 soinn 网络 在线 联网 设备 识别 方法 | ||
1.一种基于SOINN网络的在线物联网设备识别方法,其特征在于,包括以下步骤:
(1)结构化特征提取,
(2)非结构化特征提取,
(3)设备品牌识别,
(4)设备型号识别。
2.根据权利要求1所述的基于SOINN网络的在线物联网设备识别方法,其特征在于,步骤(1)结构化特征提取:具体如下,
1.1从数据库中获取设备的交互页面代码;
1.2设置结构化特征F的初始值,长度为256,每一位为0,依次顺序遍历HTML代码的每一层,提取每层包含的HTML节点标签,记为:t1,t2,…tn;
1.3对每一层标签进行如下处理:
1.3.1利用该层标签产生所有三元组全排列组合,记为C1,C2,…,Cm;
1.3.2利用md5哈希算法计算每个Ci的哈希值,并求该哈希值除以256的余数,记为h。
1.3.3在结构化特征F的第h位累加1;
1.4顺序遍历完HTML的所有层,重复步骤1.3,得到结构化特征F;
1.5累加特征F所有位的数值,并除以256得到平均值avg;
1.6对特征F二值化,每一位按照以下公式进行赋值,得到最终的设备结构化特征。
其中F[i]是结构化特征F的第i位。
3.根据权利要求1所述的基于SOINN网络的在线物联网设备识别方法,其特征在于,
步骤(2)非结构化特征提取,具体如下,
2.1从数据库读取相同品牌设备的所有文本数据;
2.2利用正则表达式从每一个文本中匹配型号关键词;
2.3利用TF-IDF技术计算每一个关键词对于该文本的权重值;
2.4关键词及其权重值构成每种型号设备的非结构化特征。
4.根据权利要求1所述的基于SOINN网络的在线物联网设备识别方法,其特征在于,(3)设备品牌识别,具体如下,
3.1为结构化特征打上分类标签,作为设备品牌分类器的训练数据;
3.2将所有训练数据按照品牌类别分别输入SOINN网络,进行训练数据压缩得到原型数据;
3.3利用原型数据训练SVM分类器;
3.4待识别设备经过SVM分类器识别设备的品牌;
3.5识别后的设备数据按照品牌类别输入到SOINN网络中,重复步骤3.2,3.3,更新分类模型。
5.根据权利要求1所述的基于SOINN网络的在线物联网设备识别方法,其特征在于,(4)设备型号识别,具体如下,
4.1利用正则匹配提取待识别设备文本数据中的型号关键词,得到词集合S;
4.2加载型号特征库,包含了词集合W和权重值集合M,按照下方公式计算待识别设备与型号特征库中每一个型号的文本相似度;
其中|Wb,p|为品牌b型号p的词集合元素数量,Mb,p,i为词集合中第i个词的TF-IDF权重值,Wb,p,i为词集合中的第i个词,Sj为待识别设备词集合中第j个词,d(Wb,p,i,Sj)为两个词语的Jaro距离。
4.3按照下方公式将所有的文本相似度结果归一化,得到最终的文本相似度;
4.4从归一化的相似度结果中挑选出最大值,对应的特征库型号值就是型号识别结果。
6.根据权利要求2所述的基于SOINN网络的在线物联网设备识别方法,其特征在于:在步骤1.2到1.4之间利用HTML标签全排列组合的哈希值生成设备结构化特征。
7.根据权利要求3所述的基于SOINN网络的在线物联网设备识别方法,其特征在于:在步骤2.4中将关键词及其TF-IDF权重值作为设备非结构化特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110781214.7/1.html,转载请声明来源钻瓜专利网。