[发明专利]一种基于离散度平衡的度量学习方法在审
申请号: | 201710006218.1 | 申请日: | 2017-01-05 |
公开(公告)号: | CN108280457A | 公开(公告)日: | 2018-07-13 |
发明(设计)人: | 钱冬云;金慧峰;叶聪相;陈贤敏 | 申请(专利权)人: | 浙江工贸职业技术学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京神州华茂知识产权有限公司 11358 | 代理人: | 吴照幸 |
地址: | 325000 浙江省温州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 离散度 度量 矩阵 距离度量 数据集中 样本数据 优化模型 最大边界 归一化 最大化 构建 平衡 标签属性 标签信息 实验验证 学习算法 样本类别 样本特征 约束条件 分类 求解 映射 迭代 学习 样本 采集 重心 | ||
1.一种基于离散度平衡的度量学习方法,其特征在于,包括以下步骤:
(1)利用采集到的不平衡样本数据,根据样本数据与标签信息,求出不同类重心间的距离,进一步定义归一化离散度;
(2)将归一化离散度与几何均值结合,最大化几何均值,并使用log函数进一步平衡各类间离散度;
(3)根据样本类别标签属性,利用最大边界理论,构建最大化问题;
(4)构建度量学习算法模型,增加约束条件,使得所求距离度量有效可行,得到度量学习优化模型;
(5)根据度量学习优化模型,利用梯度下降与迭代映射方法求解优化模型,获得距离度量矩阵;
(6)提取不平衡数据集中待分类的样本特征,并使用步骤(5)获得的距离度量矩阵进行分类实验验证。
2.根据权利要求1所述的基于离散度平衡的度量学习方法,其特征在于,所述的步骤(1)中,根据样本数据与其标签信息,计算各类重心间距离并定义归一化离散度,用作刻画不同类间的离散程度,具体包括以下步骤:
11)根据样本标签信息,将所有样本划分为以下样本集合:s1,s2,…,sc,其中si包含第i类的所有样本,共c类;
12)计算每类样本的重心ui,1≤i≤c,并计算在使用距离度量矩阵A时,定义归一化类间离散度如下:
其中,qi是第i类样本的个数,dA(ui,uj)是在使用距离度量矩阵A时第i与j类样本重心间的距离;是第i与j类的归一化离散度,其刻画了两类样本间的离散程度。
3.根据权利要求2所述的基于离散度平衡的度量学习方法,其特征在于,所述的步骤(2),具体包括以下步骤:
21)将归一化离散度与几何均值结合如下:
由于几何均值不等式,当且仅当不同类间归一化离散度相等时,公式(4)取得最大值;
22)进一步采用了log函数,将其作用于公式(4)中的几何均值,使得不同类间离散度进一步平衡如下:
4.根据权利要求3所述的基于离散度平衡的度量学习方法,其特征在于,所述的步骤(3),具体操作如下:为了进一步增加判别能力,根据样本数据与类别信息,采用了最大边界理论如下:
其中,yi代表样本xi的类别标签。
5.根据权利要求4所述的基于离散度平衡的度量学习方法,其特征在于,所述的步骤(4),具体操作如下:
41)构造基于离散度平衡的度量学习算法框架如下:
其中,λ是正则化参数,用于平衡公式(7)中两项的比例;公式(7)最大化归一化离散度几何均值的同时,利用了最大边界理论,使不同类间样本距离之和尽可能大,从而获得距离度量矩阵;
42)由于公式(7)所得距离度量矩阵并不能保证其为半正定矩阵,因此,增加约束,保证其为半正定矩阵;同时,约束同类样本间距离之和小于某个常数,避免同一类样本分布距离较远;构造的度量学习框架如下,即为度量学习优化模型:
由于距离度量矩阵为半正定该矩阵,因此增加约束条件A≥0,使得度量学习求解过程保证度量矩阵为半正定;同时,约束同类样本间距离之和小于某个常数,避免同一类样本分布距离较远,则定义g(A)约束同类样本间距离之和小于1。
6.根据权利要求5所述的基于离散度平衡的度量学习方法,其特征在于,所述的步骤(5),具体包括以下步骤:
51)首先将距离度量矩阵A随机初始化;
52)求解公式(7)中L(A)对矩阵A的导数如下:
其中,
53)利用梯度上升方法,利用公式(9)求得的梯度方向,对距离度量矩阵A进行更新,即
54)将距离度量矩阵A映射至集合中;如果A不属于集合C1,则将矩阵A沿着梯度方向进行更新,直至A属于集合C1停止更新;所获得的距离度量矩阵A在尽可能保持原有矩阵性质的同时,保证了其属于集合C1;
55)为了保证矩阵A是半正定的,将矩阵A映射至集合C2={A|A≥0}A≥0中,以保证距离度量的有效性,其步骤为:将矩阵A进行特征分解,即A=PTΛP,其中Λ=diag(η1,η2,…,ηd)为矩阵A的特征值;将其中小于0的特征值用0替换,则得到Λ′=diag(max{η1,0},max{η2,0},…,max{ηd,0});则距离度量矩阵A更新为A=PTΛ′P,保证了距离度量矩阵A为半正定矩阵;
56)依次重复进行以上所有步骤直至距离度量矩阵A收敛;稳定解即为构造出的距离度量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工贸职业技术学院,未经浙江工贸职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710006218.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于锅炉内壁相贯线焊缝的识别方法
- 下一篇:群体关系类型识别方法及装置