[发明专利]一种基于依赖度的半监督多标签分类方法在审

申请号：	201811570949.X	申请日：	2018-12-21
公开（公告）号：	CN109754000A	公开（公告）日：	2019-05-14
发明（设计）人：	丁家满;罗青波	申请（专利权）人：	昆明理工大学
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	暂无信息	代理人：	暂无信息
地址：	650093 云***	国省代码：	云南;53
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种基于依赖度的半监督多标签分类方法，属于数据分类中的多标签分类技术领域。本发明基于多标签分类算法，提出了一种新的依赖度计算方法，通过引入标签依赖度，计算标签之间的相互关系，提高了多标签分类算法的效果；同时，利用半监督自训练模型，引入大量无标签数据，提高数据利用率，减少因为有标签数据获取难度较大造成的影响。
搜索关键词：	标签分类依赖度半监督标签数据算法标签数据利用率数据分类自训练引入
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于依赖度的半监督多标签分类方法，其特征在于：(1)输入有标签数据集X，无标签数据集U，测试数据集T；(2)设定半监督自训练模型循环条件，设定置信度条件；(3)若满足步骤(2)设定的循环条件，则进入循环；(4)读取步骤(1)所述的有标签数据集X，对其中每个实例计算其先验概率；(5)读取步骤(1)所述的有标签数据集X，找出每个实例的k个最近邻，根据最近邻信息确定条件概率；(6)读取步骤(1)所述的有标签数据集X，计算每两个标签之间的依赖度；(7)读取步骤(1)所述的无标签数据集U，找出其中每个实例的k个最近邻，根据最近邻信息，以及步骤(4)计算的先验概率、步骤(5)计算的条件概率、步骤(6)计算的依赖度，综合计算实例的后验概率；(8)根据步骤(7)计算的后验概率，对无标签数据集U进行分类；(9)对步骤(8)中分类后的数据集U，依次计算其每个实例的置信度；(10)若置信度满足步骤(2)中设定的置信度条件，则将其从分类后的数据集U中移除，并加入到有标签数据集X中，若置信度不满足步骤(2)中设置的置信度条件，则将其分类结果清除；(11)结束循环；(12)若不满足步骤(2)设定的循环条件，则执行步骤(13)和步骤(14)(13)读取步骤(1)所述的测试数据集T，找出其中每个实例的k个最近邻，根据最近邻信息、以及最后一次循环中步骤(4)的先验概率、步骤(5)的条件概率步骤(6)的依赖度，综合计算实例的后验概率；(14)根据步骤(12)计算的后验概率，对无测试数据集T进行分类。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于昆明理工大学，未经昆明理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201811570949.X/，转载请声明来源钻瓜专利网。

上一篇：针对任意视角汽车图片的细粒度车型识别方法
下一篇：图像分类方法、计算机存储介质及图像分类装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于依赖度的半监督多标签分类方法在审

专利文献下载