[发明专利]一种基于CFS_KL的贝叶斯加权方法有效

申请号：	202010003109.6	申请日：	2020-01-02
公开（公告）号：	CN111242179B	公开（公告）日：	2022-02-18
发明（设计）人：	桂小林;安迪	申请（专利权）人：	西安交通大学
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	西安通大专利代理有限责任公司 61200	代理人：	高博
地址：	710049 ***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于 cfs_kl 贝叶斯加权方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于CFS_KL的贝叶斯加权方法，其特征在于，包括以下步骤：

S1、分析nmap指纹库中的操作系统识别规则，拆解nmap指纹库，使用指纹库中的指纹名称作为模型的标记数据，指纹名称下的响应序列标志位构成训练数据；

S2、对训练数据进行封箱预处理操作；

S3、使用KL散度计算属性与类之间的关联度作为每个属性的权值，第i个属性Ai对应的权值M_i为：

其中，P(a_i)为第i个属性Ai的取值的概率，P(c)为类别c的先验概率，P(c|a_i)为第i个属性Ai的取值上类别为c的条件概率；

S4、使用特征选择方法选出42个维度；

S5、使用CFS选出的维度修正KL散度计算出的权重，维度修正KL散度计算出的权重为：

其中，表示被CFS方法选中的第i个维度，a_i表示没有被CFS方法选中的其他属性；

S6、使用加权贝叶斯算法进行训练；

S7、取步骤S1的训练数据，通过封箱操作将向量输入训练好的指纹模型，通过基于CFS_KL的加权贝叶斯算法，计算出每条流量的最大后验概率，完成模拟数据测试；

S8、通过向目标网段发包的方式，采集真实流量，将真实流量输入指纹模型，预测结果；计算真实流量的测试精度。

2.根据权利要求1所述的基于CFS_KL的贝叶斯加权方法，其特征在于，步骤S1中，以Fingerprint行代表的是该指纹所属的操作系统，以此作为分类的类标记，将每个响应序列加上标志位作为特征进行拆分，在选择维度时删除SEQ.SP特征，得到118个特征；按照规则集拆分指纹库，对于标志位取值SP＝0-5拆解成SP＝0，SP＝1到SP＝5；对于标志位取值GCD＝B8|114|170|1CC拆解成GCD＝B8，GCD＝114，并映射成118列的数字向量；按照蒙特卡洛方法，从拆分出的数据集中抽出90万数据作为训练数据。

3.根据权利要求2所述的基于CFS_KL的贝叶斯加权方法，其特征在于，蒙特卡洛方法具体为：

分别获取响应序列的全集，当全集数量大于500时，从全集随机挑选4个样本；当全集数量大于10小于等于500时，从全集随机挑选2个样本；当全集数量小于10时，随机挑选1个样本，获得90万数据作为模拟测试集。

4.根据权利要求1所述的基于CFS_KL的贝叶斯加权方法，其特征在于，步骤S2中，在训练数据中，对于每一个维度，取所有值，去重，按照从小到大排序，将所有数据平均分散到40个区间内，取每个区间的首尾，将区间内的数据全部映射成另外一个数字。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西安交通大学，未经西安交通大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010003109.6/1.html，转载请声明来源钻瓜专利网。

上一篇：闪存编程参数确定方法、装置、电子设备及存储介质
下一篇：一种信息监控方法、装置及可读存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于CFS_KL的贝叶斯加权方法有效

专利文献下载