[发明专利]一种基于离散度平衡的度量学习方法在审

专利信息
申请号: 201710006218.1 申请日: 2017-01-05
公开(公告)号: CN108280457A 公开(公告)日: 2018-07-13
发明(设计)人: 钱冬云;金慧峰;叶聪相;陈贤敏 申请(专利权)人: 浙江工贸职业技术学院
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 北京神州华茂知识产权有限公司 11358 代理人: 吴照幸
地址: 325000 浙江省温州市*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 离散度 度量 矩阵 距离度量 数据集中 样本数据 优化模型 最大边界 归一化 最大化 构建 平衡 标签属性 标签信息 实验验证 学习算法 样本类别 样本特征 约束条件 分类 求解 映射 迭代 学习 样本 采集 重心
【权利要求书】:

1.一种基于离散度平衡的度量学习方法,其特征在于,包括以下步骤:

(1)利用采集到的不平衡样本数据,根据样本数据与标签信息,求出不同类重心间的距离,进一步定义归一化离散度;

(2)将归一化离散度与几何均值结合,最大化几何均值,并使用log函数进一步平衡各类间离散度;

(3)根据样本类别标签属性,利用最大边界理论,构建最大化问题;

(4)构建度量学习算法模型,增加约束条件,使得所求距离度量有效可行,得到度量学习优化模型;

(5)根据度量学习优化模型,利用梯度下降与迭代映射方法求解优化模型,获得距离度量矩阵;

(6)提取不平衡数据集中待分类的样本特征,并使用步骤(5)获得的距离度量矩阵进行分类实验验证。

2.根据权利要求1所述的基于离散度平衡的度量学习方法,其特征在于,所述的步骤(1)中,根据样本数据与其标签信息,计算各类重心间距离并定义归一化离散度,用作刻画不同类间的离散程度,具体包括以下步骤:

11)根据样本标签信息,将所有样本划分为以下样本集合:s1,s2,…,sc,其中si包含第i类的所有样本,共c类;

12)计算每类样本的重心ui,1≤i≤c,并计算在使用距离度量矩阵A时,定义归一化类间离散度如下:

其中,qi是第i类样本的个数,dA(ui,uj)是在使用距离度量矩阵A时第i与j类样本重心间的距离;是第i与j类的归一化离散度,其刻画了两类样本间的离散程度。

3.根据权利要求2所述的基于离散度平衡的度量学习方法,其特征在于,所述的步骤(2),具体包括以下步骤:

21)将归一化离散度与几何均值结合如下:

由于几何均值不等式,当且仅当不同类间归一化离散度相等时,公式(4)取得最大值;

22)进一步采用了log函数,将其作用于公式(4)中的几何均值,使得不同类间离散度进一步平衡如下:

4.根据权利要求3所述的基于离散度平衡的度量学习方法,其特征在于,所述的步骤(3),具体操作如下:为了进一步增加判别能力,根据样本数据与类别信息,采用了最大边界理论如下:

其中,yi代表样本xi的类别标签。

5.根据权利要求4所述的基于离散度平衡的度量学习方法,其特征在于,所述的步骤(4),具体操作如下:

41)构造基于离散度平衡的度量学习算法框架如下:

其中,λ是正则化参数,用于平衡公式(7)中两项的比例;公式(7)最大化归一化离散度几何均值的同时,利用了最大边界理论,使不同类间样本距离之和尽可能大,从而获得距离度量矩阵;

42)由于公式(7)所得距离度量矩阵并不能保证其为半正定矩阵,因此,增加约束,保证其为半正定矩阵;同时,约束同类样本间距离之和小于某个常数,避免同一类样本分布距离较远;构造的度量学习框架如下,即为度量学习优化模型:

由于距离度量矩阵为半正定该矩阵,因此增加约束条件A≥0,使得度量学习求解过程保证度量矩阵为半正定;同时,约束同类样本间距离之和小于某个常数,避免同一类样本分布距离较远,则定义g(A)约束同类样本间距离之和小于1。

6.根据权利要求5所述的基于离散度平衡的度量学习方法,其特征在于,所述的步骤(5),具体包括以下步骤:

51)首先将距离度量矩阵A随机初始化;

52)求解公式(7)中L(A)对矩阵A的导数如下:

其中,

53)利用梯度上升方法,利用公式(9)求得的梯度方向,对距离度量矩阵A进行更新,即

54)将距离度量矩阵A映射至集合中;如果A不属于集合C1,则将矩阵A沿着梯度方向进行更新,直至A属于集合C1停止更新;所获得的距离度量矩阵A在尽可能保持原有矩阵性质的同时,保证了其属于集合C1

55)为了保证矩阵A是半正定的,将矩阵A映射至集合C2={A|A≥0}A≥0中,以保证距离度量的有效性,其步骤为:将矩阵A进行特征分解,即A=PTΛP,其中Λ=diag(η1,η2,…,ηd)为矩阵A的特征值;将其中小于0的特征值用0替换,则得到Λ′=diag(max{η1,0},max{η2,0},…,max{ηd,0});则距离度量矩阵A更新为A=PTΛ′P,保证了距离度量矩阵A为半正定矩阵;

56)依次重复进行以上所有步骤直至距离度量矩阵A收敛;稳定解即为构造出的距离度量。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工贸职业技术学院,未经浙江工贸职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710006218.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top