[发明专利]一种特征选择方法、装置及计算机系统在审
| 申请号: | 202010523591.6 | 申请日: | 2020-06-10 |
| 公开(公告)号: | CN111783843A | 公开(公告)日: | 2020-10-16 |
| 发明(设计)人: | 朱延飞 | 申请(专利权)人: | 苏宁金融科技(南京)有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 张慧娟 |
| 地址: | 211800 江苏省南京市江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 特征 选择 方法 装置 计算机系统 | ||
1.一种特征选择方法,其特征在于,包括:
利用第一预设模型对输入的待处理数据集进行预测,生成第一预测结果及所述第一预设模型对所述待处理数据集包含的特征的第一重要性评价,所述预测结果包括预测的所述待处理数据集包含的样本所属的分类;
利用第二预设模型对所述待处理数据集进行预测,生成第二预测结果及所述第二预设模型对所述特征的第二重要性评价;
利用第三预设模型根据所述第一预测结果及所述第二预测结果,生成所述第一预设模型对应的第一权重及所述第二预设模型对应的第二权重;
根据所述第一权重、所述第一重要性评价、所述第二权重及所述第二重要性评价,确定每一所述特征对应的特征重要性;
确定对应的特征重要性满足预设条件的所述特征为目标特征。
2.根据权利要求1所述的方法,其特征在于,所述第一预设模型、所述第二预设模型包括自适应提升模型及随机森林模型。
3.根据权利要求1或2所述的方法,其特征在于,所述第三预设模型包括逻辑回归模型。
4.根据权利要求1或2所述的方法,其特征在于,所述方法包括:
剔除所述待处理数据集中除所述目标特征以外的特征,生成目标数据集;
利用第四预设模型对所述目标数据集进行预测,生成目标预测结果,所述第四预设模型包括所述第一预设模型及所述第二预设模型。
5.根据权利要求1或2所述的方法,其特征在于,所述根据所述第一权重、所述第一重要性评价、所述第二权重及所述第二重要性评价,确定每一所述特征对应的特征重要性包括:
根据FP=(w1*fp1+w2*fp2)/(w1+w2),计算每一所述特征对应的特征重要性,其中FP表示每一特征的特征重要性,W1表示第一权重,fp1表示所述第一重要性评价,w2表示第二权重,fp2表示所述第二重要性评价。
6.根据权利要求1或2所述的方法,其特征在于,所述确定对应的特征重要性满足预设条件的所述特征为目标特征包括:
生成包含每一所述特征及所述特征对应的特征重要性的特征字典表;
将所述特征字典表按照所述特征重要性降序排列;
从排序后的所述特征字典表中获取对应的所述特征重要性满足所述预设条件的目标特征。
7.一种特征选择装置,其特征在于,包括:
训练模块,所述训练模块用于利用第一预设模型对输入的待处理数据集进行预测,生成第一预测结果及所述第一预设模型对所述待处理数据集包含的特征的第一重要性评价,所述预测结果包括预测的所述待处理数据集包含的样本所属的分类;利用第二预设模型对所述待处理数据集进行预测,生成第二预测结果及所述第二预设模型对所述特征的第二重要性评价;
预测模块,所述预测模块用于利用第三预设模型根据所述第一预测结果及所述第二预测结果,生成所述第一预设模型对应的第一权重及所述第二预设模型对应的第二权重;
处理模块,用于根据所述第一权重、所述第一重要性评价、所述第二权重及所述第二重要性评价,确定每一所述特征对应的特征重要性;确定对应的特征重要性满足预设条件的所述特征为目标特征。
8.根据权利要求7所述的装置,其特征在于,所述第一预设模型、所述第二预设模型包括自适应提升模型及随机森林模型。
9.根据权利要求7或8所述的装置,其特征在于,所述处理模块还可用于根据FP=(w1*fp1+w2*fp2)/(w1+w2),计算每一所述特征对应的特征重要性,FP表示每一特征的特征重要性,w1表示第一权重,fp1表示所述第一重要性评价,w2表示第二权重,fp2表示所述第二重要性评价。
10.一种计算机系统,其特征在于,所述系统包括:
一个或多个处理器;
以及与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行如下操作:
利用第一预设模型对输入的待处理数据集进行预测,生成第一预测结果及所述第一预设模型对所述待处理数据集包含的特征的第一重要性评价,所述预测结果包括预测的所述待处理数据集包含的样本所属的分类;
利用第二预设模型对所述待处理数据集进行预测,生成第二预测结果及所述第二预设模型对所述特征的第二重要性评价;
利用第三预设模型根据所述第一预测结果及所述第二预测结果,生成所述第一预设模型对应的第一权重及所述第二预设模型对应的第二权重;
根据所述第一权重、所述第一重要性评价、所述第二权重及所述第二重要性评价,确定每一所述特征对应的特征重要性;
确定对应的特征重要性满足预设条件的所述特征为目标特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏宁金融科技(南京)有限公司,未经苏宁金融科技(南京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010523591.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:量热分析技术在聚羧酸减水剂工业放大过程中的应用
- 下一篇:一种铁锤装配装置





