[发明专利]样本类别标签的修正方法、装置以及电子设备有效

专利信息
申请号: 201910703812.5 申请日: 2019-07-31
公开(公告)号: CN110428003B 公开(公告)日: 2022-04-22
发明(设计)人: 刘世霞;向首兴;叶曦;李岩;张志伟 申请(专利权)人: 清华大学;北京达佳互联信息技术有限公司
主分类号: G06V10/764 分类号: G06V10/764;G06V10/762;G06K9/62;G06T3/00
代理公司: 北京同达信恒知识产权代理有限公司 11291 代理人: 王英
地址: 10008*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 样本 类别 标签 修正 方法 装置 以及 电子设备
【说明书】:

本公开公开了一种样本类别标签的修正方法、装置以及电子设备,涉及数据处理技术领域,其中,该样本类别标签的修正方法包括:响应于候选可信点选择操作指示,对实例视图中的投射点进行选择,并展示各候选可信点以及对应的类别标签;响应于用户操作对用户选中的候选可信点的类别标签进行更正得到可信数据集;基于可信数据集和各类标注数据,修正标注数据的类别标签;依据修正后的类别标签对应的渲染效果,在实例视图中渲染各类标注数据的投射点,该方式便于用户直观的观察标注数据的聚类分布,选择合适的标注数据并对类别标签有误的标注数据进行更正,通过可视化视图并结合人的经验实现对类别标签的修正,进一步地提高了样本类别标签修正的准确性。

技术领域

本公开涉及数据处理技术领域,特别涉及一种样本类别标签的修正方法、装置以及电子设备。

背景技术

随着人工智能的快速发展,机器学习被广泛应用于生产生活中。基于机器学习可以快速解决数据分类、图像识别等问题。机器学习使得人们的生产生活更加便利。在机器学习中,高质量的训练数据是有监督和半监督学习成功的一个关键因素,通常需要对样本数据标注类别标签后再进行机器学习。

然而,随着大数据时代的到来,数据快速增长,数据质量水平越来越难保证,而类别标签错误便是一种典型的数据质量问题。为了处理类别标签错误的问题,有关技术提出了使用机器学习技术来纠正类别标签,但该方法需要预先获取训练数据的类别标签特性,利用训练数据的先验知识来进行辅助检测。因此,利用该方法进行类别标签错误检测较为困难,并且对于大规模数据集而言,该方法识别类别标签错误的速度较慢,在出现大量类标错误的情况下,也不能有效地修正类别标签错误。

发明内容

本公开提供了一种样本类别标签的修正方法、装置以及电子设备,以至少解决相关技术中类别标签错误的问题。

根据本公开实施例的第一方面,提供一种样本类别标签的修正方法,包括:

响应于候选可信点选择操作指示,对实例视图中的投射点进行选择,并展示各候选可信点以及对应的类别标签;其中,所述实例视图用于将标注数据的聚类分布进行可视化展示;所述投射点为各类标注数据在二维平面或三维空间的投射点,且,所述投射点保留有各类标注数据的局部结构,在所述实例视图中不同类别标签的投射点的渲染效果不同,同一类投射点的渲染效果相同;响应于用户操作对用户选中的候选可信点的类别标签进行更正得到可信数据集;基于所述可信数据集和所述各类标注数据,利用双重优化标注数据的修正方法,修正所述标注数据的类别标签;依据修正后的类别标签对应的渲染效果,在所述实例视图中渲染各类标注数据的投射点。

可选的,所述投射点依照层次结构图划分为多个层级,则所述响应于候选可信点选择操作指示,对实例视图的投射点进行选择之前,所述方法还包括:对所述标注数据进行特征提取得到特征数据;对所述特征数据进行逐级递减采样,按照采样层级对应得到的多个层级的特征数据,将每相邻层级特征数据按照上下级关系进行级联,构建层次结构图。

可选的,还包括:响应于在所述实例视图中候选区域的选择操作指令,标识选择的候选区域;确定接收到更细粒度的展示操作指令后,确定候选区域内包含投射点的下一层级的级联的投射点,并在所述实例视图中渲染。

可选的,所述对实例视图中的投射点进行选择之后,并在所述响应于用户操作对用户选中的候选可信点的类别标签进行更正得到可信数据集之前,还包括:从候选可信点集中选择指定数量的候选可信点,其中,所述指定数量为根据用户设置确定的数量。

可选的,所述响应于用户操作对用户选中的候选可信点的类别标签进行更正得到可信数据集,包括:响应于对展示的候选可信点的用户选择操作,对选择的候选可信点渲染选中标识;响应于用户对类别标签的选择操作,将选择的候选可信点的类别标签更正为用户选择的类别标签。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;北京达佳互联信息技术有限公司,未经清华大学;北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910703812.5/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top