[发明专利]一种用于k近邻分类的线性特征提取方法无效
申请号: | 200710047970.7 | 申请日: | 2007-11-08 |
公开(公告)号: | CN101159019A | 公开(公告)日: | 2008-04-09 |
发明(设计)人: | 张巍;薛向阳;孙子晨;郭跃飞 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62 |
代理公司: | 上海正旦专利代理有限公司 | 代理人: | 陆飞;盛志范 |
地址: | 20043*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于统计模式识别与机器学习技术领域,具体为一种用于k近邻分类的线性特征提取方法。本发明提出多类数据点在局部引力和局部斥力的作用下形成一个邻接图模型以及表示该图模型的鉴别邻接矩阵。从目标函数导出一个非半正定的对称矩阵,对该矩阵进行谱分析可知,将数据映射到由这个矩阵负特征值对应的特征向量张成的空间中去时,近邻分类的准确率能达到最大。本方法通过谱分析来确定适合于分类的新空间的最佳维数,而不是如已有方法那样只能在实验中不断调试得到。而且,该方法还具有非参数、非迭代、避免局部小、避免奇异矩阵等优点。 | ||
搜索关键词: | 一种 用于 近邻 分类 线性 特征 提取 方法 | ||
【主权项】:
1.一种用于k近邻分类的线性特征提供方法,设X=[x1,x2,...,xn]为原空间RD中的n个样本,要寻找一个线性映射P,使X在该线性映射下得到的新空间中,同类近邻点之间尽可能的近,异类近邻点之间尽可能的远:[ x 1 , x 2 , . . . , x n ] → P [ P T x 1 , P T x 2 , . . . , P T x n ] - - - ( 1 ) ]]> 同类近邻点之间的紧度定义为:Δ = Σ ii | | P T x i - P T x j | | 2 , - - - ( 2 ) ]]> (xi∈NeigI(j)∨xj∈NeigI(i))其中NeigI(i)表示点xi的同类近邻集合,可以简单地利用k近邻分类实现;异类近邻点之间的散度定义为:δ = Σ i , j | | P T x i - P T x j | | 2 , - - - ( 3 ) ]]> (xi∈NeigE(j)∨xj∈NeigE(i))其中NeigE(i)表示点xi的异类近邻集合,同样可以利用k近邻分类来实现;即目标函数,Ψ = Δ - δ ]]>= = Σ i , j | | P T x i - P T x j | | 2 F ij - - - ( 4 ) ]]> 为最小,其中:
具体计算步骤如下:(1)根据公式(5)计算实对称矩阵X(S-F)X,其中F=[Fij]n×n,S = [ S ij ] n × n = Σ j = 1 n F ij i = j 0 i ≠ j ; ]]> (2)对实对称矩阵X(S-F)X进行特征值分解,求得的特征值和特征向量分别为λj和Pj,j=1,2,…,D;(3)设所有负特征值的个数为d,将特征值λj从小到大排序:λ1≤...≤λd<0≤λd+1≤...,前d个特征所值对应的特征向量P=[P1,P2,...,Pd]即为所求的线性映射,使得原空间中的样本X在该映射[ x 1 , x 2 , . . . , x n ] → P [ P T x 1 , P T x 2 , . . . , P T x n ] ]]> 下同类近邻点之间尽可能的近,异类近邻点之间尽可能的远。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200710047970.7/,转载请声明来源钻瓜专利网。
- 上一篇:洗车废水回收器
- 下一篇:制备2,6-二乙酰基吡啶的方法