[发明专利]基于DA-RBM分类器模型的手写数据识别方法有效

专利信息
申请号: 201810595182.X 申请日: 2018-06-11
公开(公告)号: CN109034186B 公开(公告)日: 2022-05-24
发明(设计)人: 赵子恒;赵煜辉;刘赣;单鹏 申请(专利权)人: 东北大学秦皇岛分校
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 北京联创佳为专利事务所(普通合伙) 11362 代理人: 刘美莲;郭防
地址: 066004 河北省秦皇岛市经*** 国省代码: 河北;13
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 da rbm 分类 模型 手写 数据 识别 方法
【说明书】:

发明涉及一种建立DA‑RBM分类器模型的方法,所述方法包括如下步骤:获取源域数据Xs、与源域数据Xs对应的标签Ys、目标域数据XT以及标签YT;初始化RBM模型参数,将数据Xs、XT输入到RBM网络中,求出一阶特征;将所述一阶特征作为下一阶网络的输入,进行RBM训练;将RBM的隐层输出Hs、HT输入到softmax回归层进行分类;在RBM隐层输出上使用MMD进行源域数据和目标域数据分布的约束;在RBM模型的顶层分类层中使用MMD进行预测结果的约束;构建模型的总代价函数J(θ),通过优化所述总代价函数来优化分类器模型的参数。本发明所建模型能够对跨域数据进行有效识别。

技术领域

本发明涉及深度学习识别领域,具体而言,涉及一种建立DA-RBM分类器模型的方法。

背景技术

字符识别信息一般分为两种,一种是对于文字信息的识别,主要是不同国家或不同民族的文字等印刷品的识别,例如报刊信息,手写文字等信息。另一种是数据信息的识别,在数字信息识别领域有很重要的应用,如企业报表数据、银行报表数据、邮政编码数据等一系列的数据。在这一系列的数字信息中,都需要耗费很大的人力物力去监管处理这些数据,尤其是金融业日益发展的今天,处理的数据量也越来越大,如果仅仅使用人工去处理,则会出现效率低下,并且错误率比较大。如果能自动化的处理这些信息无疑是非常便利的,这不仅仅可以降低出粗概率也可以节约大量的时间。如果要进行手写数字的识别,则需要对这些数据进行分类。选择合适的识别算法对于提高手写数字的识别率有很重大的影响。因此,如果能够处理好手写数字字体的识别的技术对于金融领域以及其他和数据打交道的领域都有很大的益处。并且在当前社会来说,一切工作都要求智能化,通过手写数字识别技术,可以简化录入数据、校检数据等工作的流程及提高工作效率。随着计算机技术的提升尤其是机器学习的进步,使用机器学习算法进行手写数字的识别逐渐被人们重视起来,这为自动化的识别手写数字带来了福音。在机器学习领域深度学习算法正在受到越来越多的关注,因此将深度学习算法应用到手写数字识别技术也成为热点,并且在这一方面也取得的很好的成果,例如谷歌实验室在使用卷积神经网络识别手写数字时已经几乎可以将识别率达到99%以上。这为商业使用提供了试验依据,将深度学习算法应用到手写数字识别技术拓展了数字识别的方向,将关注放在使用深度学习的方法处理手写数字识别上。

在深度学习领域传统的机器学习算法在处理手写数字识别时很好的执行效果,但是传统的深度学习算法例如RBM(受限玻尔兹曼机)等要求处理的数据属于同一分布,也就是训练数据和测试数据来自同一数据集。而现实世界中手写数字字体的识别来自不同的数据集,也就是他们的分布不同,因此在使用传统的深度学习算法去分类混合域数据则会出现不适应的情况。并且传统的机器学习算法训练一个可靠的模型需要大量的训练采样,在现实世界中,有时是很难获取到足够多的有标签的可用于训练的数据。使用有标签的数据集去训练模型然后将这个模型应用于一个和有标签数据集相关但是不同的目标任务上在现实的生活中有很重要的应用。

发明内容

本发明为了克服训练数据和测试数据来自不同数据集时所带来的不适应问题,提供了一种一种建立DA-RBM分类器模型的方法,所述方法包括如下步骤:

S110、获取源域数据Xs、与源域数据Xs对应的标签Ys、目标域数据XT以及标签YT

S120、初始化RBM模型参数,将数据Xs、XT输入到RBM网络中,求出一阶特征;

S130、将所述一阶特征作为下一阶网络的输入,进行RBM训练;

S140、将RBM的隐层输出Hs、HT输入到softmax回归层进行分类;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学秦皇岛分校,未经东北大学秦皇岛分校许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810595182.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top