[发明专利]一种实现对手写体字符拒识的方法有效
申请号: | 201710954869.3 | 申请日: | 2017-10-13 |
公开(公告)号: | CN107679505B | 公开(公告)日: | 2020-04-21 |
发明(设计)人: | 林辉 | 申请(专利权)人: | 林辉 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/08 |
代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 宋艳艳 |
地址: | 100089 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实现 手写体 字符 方法 | ||
本发明公开了一种实现对手写体字符拒识的方法,首先采集并训练手写笔迹数据,获取训练笔迹数据;建立堆栈式RBN神经网络,读取训练笔迹数据,对模型进行搭建、训练和保存;读取训练笔迹数据和模型,并计算出训练笔迹数据的重构误差数据;重复多次重构误差数据的计算,得到重构误差数据集合,并通过计算重构误差数据集合R,获取并保存置信区间;然后输入新的手写笔迹数据,通过判断新的手写笔迹数据的重构误差是否在置信区间内来确定是否拒识该新的手写笔迹数据。本发明采用深度信念网络的解码重构损失作为输入字符笔迹是否属于系统支持字符类型的置信度评价以及一个阈值来判断是否拒识;可有效的拒识字符笔迹,使在低错误拒识率的前提下具有较高的正确拒识率。
技术领域
本发明涉及手写体字符识别领域,具体涉及一种实现对手写体字符拒识的方法。
背景技术
随着模式识别和人工智能技术的发展,手写文本机器识别技术得到了有效的应用,同时相关的理论、技术、方法也得到了很大的发展,手写体字符识别技术作为手写文本识别技术的基础功能模块更是得到了广泛关注和大力研究。
手写体字符识别问题在本质上是一个分类问题,每一个识别系统有其支持的字符集,手写体字符识别的算法需要确定一个手写字符笔迹属于字符集中的哪一类字符,并在大多数的情况下给出一个可信度分值。
在现今,得益于机器学习和深度学习的发展,基于支持向量机(Support VectorMechine,SVM)、卷积神经网络(Convolutional Neural Network,CNN)等方法手写体字符识别的准确率达到了历史的高度,在某些测试中甚至超过了人类的识别水平。
然而,当有不属于系统支持字符集中的字符笔迹或者根本不是一个有意义的字符笔迹输入到识别算法中时,识别算法往往以高置信度分值把它分类为字符集中的某一个字符,这样的结果显然是荒谬的;在现有手写体字符识别过程中,其解决方法是通过加入大量的支持字符集之外的字符笔迹样本并把它们作为一个拒识类来训练,但是这需要大量的人工标记,同时由于这些字符笔迹样本没有同一的特征,通过机器学习等算法很难对它们进行特征识别,所以识别效果不好,识别的准确度不高。
发明内容
基于此,针对上述问题,有必要提出一种实现对手写体字符拒识的方法,其原理采用深度信念网络的解码重构损失作为输入字符笔迹是否属于系统支持字符类型的置信度评价以及一个阈值来判断是否拒识;使得可有效的拒绝识别不属于系统支持字符集中的字符笔迹,在低错误拒识率的前提下具有较高的正确拒识率。
本发明的技术方案是:
一种实现对手写体字符拒识的方法,包括以下步骤:
a、采集手写笔迹数据,并对所采集的手写笔迹数据进行训练处理,获取训练笔迹数据;
b、建立堆栈式RBN神经网络,并读取步骤a中训练笔迹数据,对模型进行搭建、训练和保存;
c、读取步骤a中的训练笔迹数据和步骤b中的模型,并根据模型计算出训练笔迹数据的重构误差数据;
d、重复多次步骤c,得到重构误差数据集合R,通过计算重构误差数据集合R,获取置信区间,并保存该置信区间数据;
e、输入新的手写笔迹数据,并计算出新的手写笔迹数据的重构误差,通过判断该重构误差是否在步骤d的置信区间内来确定是否拒识该新的手写笔迹数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于林辉,未经林辉许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710954869.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种除渣的钢板切割机
- 下一篇:一种双孔双液注浆方法