[发明专利]一种图的特征选择方法及系统有效
| 申请号: | 202010679163.2 | 申请日: | 2020-07-15 |
| 公开(公告)号: | CN111898710B | 公开(公告)日: | 2023-09-29 |
| 发明(设计)人: | 何芳;贾维敏;张峰干;伍宗伟;沈晓卫;赵建伟;胡豪杰;金伟;何佑明;朱玉杰 | 申请(专利权)人: | 中国人民解放军火箭军工程大学 |
| 主分类号: | G06V10/771 | 分类号: | G06V10/771;G06V10/766;G06V10/778;G06F17/14;G06F17/16 |
| 代理公司: | 北京高沃律师事务所 11569 | 代理人: | 崔玥 |
| 地址: | 710025 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 特征 选择 方法 系统 | ||
本发明涉及一种图的特征选择方法及系统。所述方法包括根据图的像素点构造自适应近邻图;根据所述图的像素点确定投影矩阵;对所述初始图和所述投影矩阵进行半监督学习,得到半监督特征选择模型;获取待特征选择的图;采用所述半监督特征选择模型对所述待特征选择的图进行特征选择。本发明所提供的一种图的特征选择方法及系统,选取数据的重要特征,降低数据间的冗余性,解决大规模数据降维问题。
技术领域
本发明涉及机器学习领域,特别是涉及一种图的特征选择方法及系统。
背景技术
随着时代的进步,社会的发展,海量高维数据的处理是当前大数据时代下不可避免的任务。大量不同媒体源都会产生海量高维形式的数据,如文本数据、图像数据、视频数据、交易数据和基因数据等。降维算法是处理高维数据的有效手段。采用合适的降维算法可以减少存储,降低计算负担,同时也能减少冗余特征。
根据实现方式的不同,降维方法又可以分为特征提取和特征选择。特征提取方法采用合适的映射函数将高维数据映射到低维空间,实现对高维特征的重组,生成新的特征分量形成数据的低维表示。特征选择方法要求不改变原始特征,从中选取出有价值的特征子集。特征选择方法能够保留数据的物理意义,具有重要的研究价值。
根据是否利用类标信息,特征选择方法又可以分为:有监督,无监督和半监督方法。有监督的特征选择方法需要利用大量的类标信息训练模型,往往能取得较好的效果。无监督的特征选择方法不需要任何类标信息,能解决重要的现实问题,但是效果并不一定能达到最佳。半监督特征选择方法利用少量的类标信息和大量的无类标信息共同训练模型,具有重要的现实意义。但是,传统的基于图的半监督特征选择方法一般是输入初始图,然后进行特征选择。图的质量直接影响后续特征选择的结果。既无法解决大规模数据降维问题。
发明内容
本发明的目的是提供一种图的特征选择方法及系统,选取数据的重要特征,降低数据间的冗余性,解决大规模数据降维问题。
为实现上述目的,本发明提供了如下方案:
一种图的特征选择方法,包括:
根据图的像素点构造自适应近邻图;所述自适应近邻图作为初始图;
根据所述图的像素点确定投影矩阵;
对所述初始图和所述投影矩阵进行半监督学习,得到半监督特征选择模型;所述半监督特征选择模型用于进行所述初始图的优化和特征选择;
获取待特征选择的图;
采用所述半监督特征选择模型对所述待特征选择的图进行特征选择。
可选的,所述根据图的像素点构造自适应近邻图,具体包括:
根据所述图的像素点确定相似矩阵;
根据所述相似矩阵构造所述自适应近邻图。
可选的,所述根据所述相似矩阵构造所述自适应近邻图,具体包括:
利用公式确定所述自适应近邻图的目标函数;其中,为相似矩阵的第i行,α是规则化参数,为规则化项,用于避免出现平凡解,即与像素点xi距离最近的点成为xi近邻的概率为1,而其他像素点都不是xi的近邻;
利用拉格朗日函数法对所述自适应近邻图的目标函数进行求解。
可选的,所述对所述初始图和所述投影矩阵进行半监督学习,得到半监督特征选择模型,具体包括:
利用公式确定所述半监督特征选择模型的目标函数;其中,W为投影矩阵,α、γ和λ均为规则化参数,γ||W||2,1为稀疏项用于对W进行稀疏约束,为平滑项,衡量投影后特征的平滑性,LS为拉普拉斯矩阵,F为像素点的标签;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军火箭军工程大学,未经中国人民解放军火箭军工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010679163.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种元器件进料机构
- 下一篇:一种页面访问数据的统计方法及装置





