[发明专利]基于子空间表示和全局消歧方法的偏标记学习方法在审
申请号: | 202010411587.0 | 申请日: | 2020-05-15 |
公开(公告)号: | CN111581467A | 公开(公告)日: | 2020-08-25 |
发明(设计)人: | 李浥东;冯松鹤;孙悦;郎丛妍 | 申请(专利权)人: | 北京交通大学 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06N20/00 |
代理公司: | 北京市商泰律师事务所 11255 | 代理人: | 黄晓军 |
地址: | 100044 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 空间 表示 全局 方法 标记 学习方法 | ||
1.一种基于子空间表示和全局消歧方法的偏标记学习方法,其特征在于,包括:
构建特征矩阵和候选标记矩阵;
基于所述构建特征矩阵和候选标记矩阵,构建特征子空间学习模型和标记全局消歧模型;
综合所述特征子空间学习模型和所述标记全局消歧模型得到混合模型,采用交替优化方法求解所述混合模型,得到多分类模型、映射矩阵和偏标记置信度矩阵;
根据所述多分类模型和所述映射矩阵对未见示例进行分类,计算出所述未见示例的多个标记值,将预测置信度最高的标记值对应的标记确定为所述未见示例所属的标记类别。
2.根据权利要求1所述的方法,其特征在于,所述的构建特征矩阵和候选标记矩阵,包括:
构建特征矩阵X∈[0,1]dxn,其中d和n分别表示特征维度数目和样本数目,构建候选标记矩阵Y∈{0,1}mxn,其中m和n分别表示类别数目和样本数目,初始化标记置信度矩阵P∈[0,1]mxn,其中m和n分别表示类别数目和样本数目,P的数值越接近于1,说明该标记是示例的真实标记的可能性越大;P的数值越接近于0,说明该标记是示例的真实标记的可能性越小。
3.根据权利要求2所述的方法,其特征在于,所述的基于所述构建特征矩阵和候选标记矩阵,构建特征子空间学习模型和标记全局消歧模型,包括:
构建特征子空间学习模型,利用特征子空间学习模型学习得到新的特征表示,生成映射矩阵其中d与d′分别表示原始特征空间的维度与子空间的特征维度;
构建标记全局消歧模型,利用标记全局消歧模型训练得到新的特征表示和候选标记矩阵,利用所述标记全局消歧模型生成偏标记置信度矩阵P∈[0,1]mxn,多分类模型其中其中d‘与m分别表示子空间的特征维度与类别数目。
4.根据权利要求3所述的方法,其特征在于,所述的构建特征子空间学习模型,利用特征子空间学习模型学习得到新的特征表示,生成映射矩阵其中d与d′分别表示原始特征空间的维度与子空间的特征维度,包括:
构建子空间学习模型,生成映射矩阵使用K近邻的方法构建示例的相似度矩阵构建图拉普拉斯矩阵L=D-S,D是一个对角矩阵,对角元素为相似度矩阵S每一行的和,对所述映射矩阵加上图拉普拉斯约束Tr(QTXLXTQ);
设正交约束QTQ=Id‘,其中Id‘是尺寸为d′的单位矩阵,采用了最小二乘损失学习新生成的特征表示与标记空间的映射关系,合并各项后,子空间学习模型的目标函数表示如下:
s.t.QTQ=Id‘
其中,λ1为超参数,用于调节正则项在损失函数中的比重,XT代表X的转置,PT代表P的转置。
5.根据权利要求4所述的方法,其特征在于,所述的构建标记全局消歧模型,利用标记全局消歧模型训练得到新的特征表示和候选标记矩阵,利用所述标记全局消歧模型生成偏标记置信度矩阵P∈[0,1]mxn,多分类模型其中其中d‘与m分别表示子空间的特征维度与类别数目,包括:
构建全局消岐策略模型,生成映射矩阵和偏标记置信度矩阵P∈[0,1]mxn。
在训练全局消歧策略模型的过程中,利用标记上下文语义信息从整体对偏标记候选矩阵消歧,生成偏标记置信度矩阵P∈[0,1]mxn,对偏标记置信度矩阵P加上l1的范数约束,对偏标记置信度矩阵P加上图拉普拉斯约束Tr(PLPT),在偏标记置信度矩阵P中引入不等式约束,确保偏标记置信度矩阵P中的每一项都大于等于零,并且小于等于原来的候选标记;
合并各项后,全局消岐策略模型的目标函数表示如下:
其中,λ2,β为超参数,用于调节正则项在损失函数中的比重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010411587.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:立体车库
- 下一篇:一种双层宽度方向扩展的方舱结构