[发明专利]一种改进基于相关性特征选择的特征过滤方法及装置在审
申请号: | 201910334368.4 | 申请日: | 2019-04-24 |
公开(公告)号: | CN110135469A | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 崔灿;刘斌;李国旗 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京慕达星云知识产权代理事务所(特殊普通合伙) 11465 | 代理人: | 曹鹏飞 |
地址: | 100089*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种改进基于相关性特征选择的特征过滤方法及装置,该方法针对软件缺陷预测中的分类任务,通过统计使用CFS方法选择的各个特征的占比重率与特征在原始数据集中占比重率来计算两者的相似度,并通过排序选出排名前K个特征,解决了特征选择中过滤方法效率高但预测模型性能差的问题,并且实现对软件预测模型的数据预处理指导,满足在数据充足但数据中存在无关特征或冗余特征情况下,对数据进行预处理,提高数据质量的需求;另一方面,该方法简单、容易实现、运行时间短,构建的软件缺陷预测模型准确度高。 | ||
搜索关键词: | 特征选择 软件缺陷 特征过滤 预测模型 预处理 数据预处理 准确度 方法选择 冗余特征 软件预测 原始数据 相似度 构建 排序 过滤 改进 分类 预测 统计 | ||
【主权项】:
1.一种改进基于相关性特征选择的特征过滤方法,其特征在于,包括:将用于缺陷预测分类任务的N个数据集中类标签的数值类型转换为二元类型;统计每个特征在原始数据集中的平均占比重率;统计每个特征经过基础特征选择筛选后在数据集中的平均占比重率;计算各个特征在原始数据集中的平均占比重率与用特征选择筛选后各个特征的平均占比重率的相似度;将所述相似度按由大到小的顺序排列,选择所述相似度排名前K个特征作为特征选择结果,完成特征过滤。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910334368.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种煤矸石的识别方法
- 下一篇:一种基于多模态车辆特征识别的车辆特征融合系统