[发明专利]一种基于扩展熵的无监督特征的选择方法及系统在审
申请号: | 201710606624.1 | 申请日: | 2017-07-24 |
公开(公告)号: | CN107368587A | 公开(公告)日: | 2017-11-21 |
发明(设计)人: | 孙占全;杨美红;李钊 | 申请(专利权)人: | 山东省计算中心(国家超级计算济南中心) |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N3/08 |
代理公司: | 北京高沃律师事务所11569 | 代理人: | 王戈 |
地址: | 250000 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 扩展 监督 特征 选择 方法 系统 | ||
1.一种基于扩展熵的无监督特征的选择方法,其特征在于,所述选择方法包括:
根据原始备选特征集中的任意备选特征变量与所述原始备选特征变量集中剩余备选特征变量之间的相关度,从所述原始备选特征集中选择第一个特征变量,并将所述第一个特征变量添加到已选特征集中,从所述原始备选特征集中剔除所述第一个特征变量;
根据当前备选特征集中的任意备选特征变量与所述备选特征集中剩余备选特征变量之间的相关度、当前备选特征集中的任意特征变量与已选特征集之间的信息损失量,确定当前特征变量以及对应的相关度变化参数;
将当前特征变量添加到已选特征集中,更新已选特征集;
判断所述相关度变化参数是否小于设定阈值,如果是则选择结束,当前已选特征集包含全部无监督特征变量;否则,将从当前备选特征集中剔除当前特征变量,更新备选特征集,继续选择下一个特征变量。
2.根据权利要求1所述的基于扩展熵的无监督特征的选择方法,其特征在于,所述根据原始备选特征集中的任意备选特征变量与所述原始备选特征变量集中剩余备选特征变量之间的相关度,从所述原始备选特征集中选择第一个特征变量,具体包括:
根据以下公式确定备选特征集中各个特征变量yi对应的扩展概率r(j|yi):
其中,yi=(yi1,yi2,...,yin),i=1,2,...,m,m表示备选特征变量的序号,n表示每个备选特征变量的特征值的序号,j=1,2,...,n;
将两个备选特征变量yp,yq,p,q∈{1,2,...,m},合并所生成c的扩展概率r(j|c):
根据以下公式计算当前备选特征集中的各备选特征变量与当前备选特征集中其余备选特征变量之间的信息损失量d(yi,{Yk/yi}):
其中,|·|表示向量的势;
根据以下公式确定所述第一个特征变量
ρ(yi,{Y0/yi})=1/d(yi,{Y0/yi});
其中,0≤k≤m,Yk表示原始备选特征集中剔除了k个特征向量的备选特征集,Y0表示原始备选特征集,Y0={y1,y2,...,ym},Y0/yi表示原始备选特征集Y0中除备选特征变量yi以外的剩余备选特征变量,argmax()为取最大值函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东省计算中心(国家超级计算济南中心),未经山东省计算中心(国家超级计算济南中心)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710606624.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:UVLED光整形组件
- 下一篇:一种反射器