[发明专利]一种知识产权图形识别中增强分类模型抗背景变化能力的方法在审
申请号: | 202110323176.0 | 申请日: | 2021-03-26 |
公开(公告)号: | CN112926679A | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 陆虎;蒋可;姚尧;耿霞;王婷婷 | 申请(专利权)人: | 江苏大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 212013 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 知识产权 图形 识别 增强 分类 模型 背景 变化 能力 方法 | ||
本发明公开了一种知识产权图形识别中增强分类模型抗背景变化能力的方法,属于图像分类技术领域,该方法包括利用背景替换后的第三原始数据集对第一原始数据集进行增强和利用增强后的第四原始数据集对分类模型进行训练,对第一原始数据集进行增强是通过将候选背景集与第一原始数据集处理得到消去背景的第二原始数据集和替换背景的第三原始数据集,并用替换背景的第三原始数据集对第一原始数据集进行扩充,进而获得增强后的第四原始数据集;再利用消去背景的第二原始数据集和增强后的第四原始数据集共同训练分类模型,本发明在遇到训练场景与实际场景中出现的背景差异较大时依然可以获得较为稳定的分类性能。
技术领域
本发明属于图像分类领域,更具体地说,是涉及一种知识产权图形识别中增强分类模型抗背景变化能力的方法。
背景技术
随着人工智能的普及,日常生活中我们已经在许多地方利用到分类算法,如人脸识别、拍照识别物品属于什么垃圾、拍照搜索相似商品等,分类算法的普及给我们的生活带来了巨大的便利。
目前,知识产权图形AI识别领域中,需要识别的图形包括可认读的文字(中文及英文或拼音)以及图形logo、外观专利等,目前这一领域取得了不错识别效果,但是现行的分类算法大多基于深度学习技术来实现,而深度学习模型的训练则依赖于模型的设计和训练集的提供,只有良好的模型设计和包含面广泛的数据集才能给分类模型带来优越的性能,从而胜任设计场景下的分类任务。虽然在大部分场景下这些分类算法都能够正常运行,但因为现实场景的复杂多变,同一个分类对象,出现在不同的场景下分类结果可能会有所差异。也即,目前的分类算法无法在现实中复杂的场景下保持稳定的分类性能,不利于分类模型在知识产权图形识别中更进一步的应用。
发明内容
本发明的目的在于提供一种增强知识产权图形(外观专利图形或者商标、版权图形)分类模型抗背景变化能力的方法,用以解决目前的分类算法无法在现实中复杂的场景下保持稳定的分类性能,不利于分类模型在知识产权图形识别中更进一步的应用的问题。
为解决上述技术问题,本发明采用的技术方案是:一种知识产权图形查询中增强分类模型抗背景变化能力的方法,包括以下步骤:消去背景的第二原始数据集和替换背景的第三原始数据集是由候选背景集和第一原始数据集通过处理算法处理得到;增强后的第四原始数据集是由第一原始数据集和替换背景的第三原始数据集联合后得到;消去背景的第二原始数据集和增强后的第四原始数据集成对的输入用来进行模型训练。
进一步,所述候选背景集是由用户设置的与第一原始数据集中的样本的背景存在一定差异的背景图片所组成。
进一步,所述处理算法具体过程为:
处理后得到的第二原始数据集中样本背景皆被消去;处理后得到的第三原始数据集中新的背景来自所述候选背景集;第三原始数据集由消去背景的第二原始数据集和背景数据集合成而来。
进一步,所述的模型训练,将增强后的第四原始数据集样本以及与该样本中的前景相对应的所述消去背景的第二原始数据集样本成对的作为输入送入模型;
所述的模型训练中,模型网络由第一分支和第二分支两个部分组成,两个分支的损失相加构成整个模型网络的分支,所述单个输入样本损失构成如下:
Ltotal=λ1Lid+λ2Lre
其中,λ1和λ2为加权系数,yi为所述第四原始数据集样本和第二原始数据集样本对应的真实标签,为所述模型预测出的标签,zi为所述对应的第二原始数据集样本,为所述第一分支抽取出的最终特征解码后的样本;CrossEntropy()为交叉熵损失函数,MSE()为均方差损失函数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110323176.0/2.html,转载请声明来源钻瓜专利网。