[发明专利]一种面向属性网络聚类的小样本主动学习方法、系统及装置在审
申请号: | 202111170455.4 | 申请日: | 2021-10-08 |
公开(公告)号: | CN113947138A | 公开(公告)日: | 2022-01-18 |
发明(设计)人: | 马小科;黄志豪;豆增发;吴文铭;王海月;李东远 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/00 |
代理公司: | 西安毅联专利代理有限公司 61225 | 代理人: | 师玮 |
地址: | 710000 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 属性 网络 样本 主动 学习方法 系统 装置 | ||
1.一种面向属性网络聚类的小样本主动学习方法,其特征在于,包括:
处理源数据:获取属性网络的邻接矩阵、属性矩阵和指示矩阵,其中,指示矩阵用来保存专家已标记节点的标签信息,即节点的类别信息;
小样本学习:利用所述指示矩阵记录属性网络中节点的类别信息,结合所述属性矩阵选取各个类别的代表性节点集合;通过所述邻接矩阵、所述属性矩阵、所述指示矩阵和代表性节点的属性矩阵以及代表性节点的指示矩阵,得到属性网络节点的全局聚类结果和社团簇原型属性;
主动学习:从所述邻接矩阵和所述全局聚类结果两个层面刻画节点不确定度,结合以上两类节点不确定度的乘积获取属性网络中各个节点的总不确定度;从所述总不确定度选取不确定度最高的节点,并提取该节点的标签信息;从所述邻接矩阵中获取标记节点集合的邻接关系,选择所有与标记节点直接相连的邻居节点,构建子网络;利用子网络的邻接矩阵和属性矩阵获取子网络节点的聚类结果;
局部更新半监督聚类:若达到最大的不确定节点可查询次数,则输出最新全局聚类结果;反之,则返回主动学习重新选取新的不确定度节点并更新子网络的聚类结果,同时更新全局聚类结果。
2.根据权利要求1所述的小样本主动学习方法,其特征在于,所述利用所述指示矩阵记录属性网络中节点的类别信息,包括:
判断所述指示矩阵是否充足;
若判断结果为充足,则计算各社团的属性平均值,并提取每个社团离中心最近的b个节点,利用所述代表性节点指示矩阵记录b个节点的类别信息;
若判断结果为不充足,利用KMeans算法对网络属性矩阵进行聚类,得到每个社团的中心点,并提取每个社团离中心最近的b个节点,利用所述代表性节点指示矩阵记录b个节点的类别信息。
3.根据权利要求1所述的小样本主动学习方法,其特征在于,所述结合所述属性矩阵选取各个类别的代表性节点集合,包括:
计算各社团中各个节点的属性与中心属性的欧式距离,选取欧式距离最小的若干节点作为社团的代表性节点集合。
4.根据权利要求1所述的小样本主动学习方法,其特征在于,所述通过所述邻接矩阵、所述属性矩阵、所述指示矩阵和代表性节点的属性矩阵以及代表性节点的指示矩阵,得到属性网络节点的全局聚类结果和社团簇原型属性,包括:
利用各个社团代表性节点集合的属性信息和类别信息,得到各社团的簇原型属性信息;
利用属性网络的邻接矩阵和属性矩阵,结合所述簇原型属性信息,通过给定的优化规则获得属性网络中各节点的全局聚类结果。
5.根据权利要求1所述的小样本主动学习方法,其特征在于,所述从所述邻接矩阵和所述全局聚类结果两个层面刻画节点不确定度,结合以上两类节点不确定度的乘积获取属性网络中各个节点的总不确定度,包括:
基于所述全局聚类结果和所述邻接矩阵的不确定度计算方法,从所述邻接矩阵采用基于社区模块度的方法获得各个节点不确定度M;
从所述全局聚类结果基于香农定理计算各个节点不确定度η;
计算各个节点不确定度M和各个节点不确定度η的乘积作为节点的总不确定度Ω。
6.根据权利要求5所述的小样本主动学习方法,其特征在于,所述从所述总不确定度选取不确定度最高的节点,并提取该节点的标签信息;包括:
节点的不确定度Ωi被认为是基于所述邻接矩阵的不确定度和基于所述全局聚类结果不确定度的乘积,将各个节点的不确定度从大到小排列,并选取不确定度最大值对应的节点作为标记节点;
对于标记节点,专家给出该标记节点的正确分类,使得标记节点的节点数量增加。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111170455.4/1.html,转载请声明来源钻瓜专利网。