[发明专利]一种针对网络协议源代码的跨域缺陷预测方法在审
| 申请号: | 202210399586.8 | 申请日: | 2022-04-15 |
| 公开(公告)号: | CN115168176A | 公开(公告)日: | 2022-10-11 |
| 发明(设计)人: | 周超;王震;苗泉强;刘义;秦富童;吴迪;王少磊;石鹏飞;樊永文 | 申请(专利权)人: | 中国人民解放军63891部队 |
| 主分类号: | G06F11/36 | 分类号: | G06F11/36;G06K9/62;H04L43/50 |
| 代理公司: | 洛阳市凯旋专利事务所(普通合伙) 41112 | 代理人: | 林志坚 |
| 地址: | 471000 河南*** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 针对 网络 协议 源代码 缺陷 预测 方法 | ||
1.一种针对网络协议源代码的跨域缺陷预测方法,其特征在于,所述步骤为:S1:获取源代码;S2:提取网络协议源代码特征;S3:通过Mean-ReSMOTE算法对数据过采样平衡数据集分布;S4:通过Hybrid-RFE+算法进行特征选择与模型训练;S5:输出预测结果。
2.根据权利要求1所述的一种针对网络协议源代码的跨域缺陷预测方法,其特征在于,所述获取源代码为:通过Github等网站搜寻获取待预测的源代码。
3.根据权利要求1所述的一种针对网络协议源代码的跨域缺陷预测方法,其特征在于,所述提取网络协议源代码特征的方法为:S2.1:确定代码度量元;S2.2:通过利用源码特征提取工具对S1中获取的源代码按照准则进行处理S2.3:获得准则属性的特征数值、代表协议源码的缺陷预测所需的训练属性。
4.根据权利要求3所述的一种针对网络协议源代码的跨域缺陷预测方法,其特征在于,所述源码特征提取工具为python库中的lizard、mulmetric。
5.根据权利要求4所述的一种针对网络协议源代码的跨域缺陷预测方法,其特征在于,所述通过Mean-ReSMOTE算法对数据过采样平衡数据集分布的方法为:S3.1:确定样本集合S1;S3.2:计算多数类样本值Nnax和少数类样本值Mnin;S3.3:计算需要生成的少数类样本值N=Nmax-Min;S3.4:基于KNM算法生成少数类新样本,放入集合S2;S3.5:对S2进行去重处理,删除相似度过近的样本;S3.6:判断S2中样本数是否大于N;S3.7:如果不大于N,重复S3.4-S3.5步骤;S3.8:如果大于N,则输出预测结果。
6.根据权利要求5所述的一种针对网络协议源代码的跨域缺陷预测方法,其特征在于,所述通过Hybrid-RFE+算法进行特征选择与模型训练:S4.1:数据集D、特征集合Fl、特征选择数目K;S4.2:对数据集 的特征进行Pearson相关系数选择和重复特征度量元素筛选;S4.3:对特性进行重要性排序,并为不同的特性子集分配不同的减重;S4.4:通过训练模型对有权值的数据集进行训练,消除权值过小的值,继续进行递归循环;S4.5:是否满足收敛条件;S4.6:如果不满足收敛条件,重复S4.3-S4.5;S4.7:如果满足收敛条件,输出预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军63891部队,未经中国人民解放军63891部队许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210399586.8/1.html,转载请声明来源钻瓜专利网。





