[发明专利]一种蒙古文在线手写体识别方法有效

专利信息
申请号: 202010544102.5 申请日: 2020-06-15
公开(公告)号: CN111695527B 公开(公告)日: 2022-07-08
发明(设计)人: 飞龙;杨帆;李敏;张晖;高光来 申请(专利权)人: 内蒙古大学
主分类号: G06V10/75 分类号: G06V10/75;G06V10/774;G06V10/30;G06V30/226;G06K9/62
代理公司: 西安知诚思迈知识产权代理事务所(普通合伙) 61237 代理人: 麦春明
地址: 010021 内蒙古自治区呼*** 国省代码: 内蒙古;15
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 蒙古文 在线 手写体 识别 方法
【说明书】:

发明公开了一种蒙古文在线手写体识别方法,获取表征手写体蒙古文单词笔画轨迹的手写体蒙古文坐标序列,同时采用表达的蒙古文单词作为标注;依次对手写体蒙古文坐标序列进行平滑化、去噪、规范化处理;将手写体蒙古文坐标序列作为样本,并将对应标注作为样本标签,对样本及样本标签进行数据转换为样本张量和样本标签张量;构建基于注意力机制的序列模型,采用样本张量和样本标签张量训练模型;对待识别手写体蒙古文单词进行处理得到新的样本张量,并将新的样本张量输入基于注意力机制的序列模型中,得到待识别手写体蒙古文单词的概率矩阵;经蒙古文字典引导,采用集束搜索算法得到识别结果,有效提升识别准确度和效率,识别率达到79.88%。

技术领域

本发明属于文字识别技术领域,涉及一种蒙古文在线手写体识别方法。

背景技术

传统蒙古文在中国的内蒙古自治区、青海省、新疆维吾尔自治区等八个省区被广泛使用,但由于蒙古文数字化较晚,且传统蒙古文是世界上公认的信息处理过程最复杂的文字之一,而现有的机器学习技术多只用于离线蒙古文手写体识别。

在线蒙古文手写体识别的输入数据包括笔尖轨迹、笔尖抬起放下以及笔尖的移动速度等。其中包含着笔画和笔顺信息,将这些笔迹自然的分离开来,形成一个个字符,一旦能够将字符分离出来,剩下的问题就是把字符映射到有限的字符集合的问题,多数分类器都可以完成这些工作。然而在实际的应用场景下,从这样的手写文字中区分出单个字符是及其困难的,字符的切分误差会直接影响到分类准确率。所以一般来说,将识别单位从字符更换为整词可以降低分割过程产生的误差,然而,蒙古文常用词规模较大,如果将文字识别形式作为输入笔迹数据到百万级的目标分类问题,则系统将面临巨大的数据稀疏问题,无法达到理想的识别准确度。除了切分问题,在实现本发明过程中,发明人发现在线蒙古文手写体识别的实现还存在以下问题:

问题一,在线手写体识别通过利用笔画的数量和笔画的走向等信息进行分类,但是由于每个人都有不同习惯的书写方式,找到一维信息中特征的分布成为了一个非常困难的事情。

问题二,在线蒙古文手写体的信息比其它语言更复杂,蒙古文在线手写体的序列要比其它语言的序列更长。一般来说,越长的数据里包含的特征信息越大,而对于机器学习来说,特征信息过多造成了学习数据中特征分布的难度更大,分类的准确率和效率更低等问题。

问题三,一般在手写的过程中为了提高书写速度,会出现连笔的情况,连笔使得划分笔迹类型的问题变得更加困难。

综上可知,现有的在线蒙古文手写体识别方法的识别效率和识别准确度较低。

发明内容

本发明实施例的目的在于提供一种蒙古文在线手写体识别方法,以解决现有的蒙古文在线手写体识别方法的准确度和识别效率较低的问题。

本发明所采用的技术方案是,一种蒙古文在线手写体识别方法,按照以下步骤进行:

步骤S1、获取移动设备保存的表征手写体蒙古文单词笔画轨迹的坐标序列即手写体蒙古文坐标序列,同时采用该手写体蒙古文坐标序列表达的蒙古文单词作为标注;

步骤S2、对手写体蒙古文坐标序列进行平滑化处理;

步骤S3、对手写体蒙古文坐标序列进行去噪处理;

步骤S4、对手写体蒙古文坐标序列进行规范化处理,使得手写体蒙古文字体大小一致;

步骤S5、将一个手写体蒙古文坐标序列作为一个样本,并将样本对应的标注作为样本标签,对样本及样本标签进行数据转换,将其转换为深度学习模型能够处理的样本张量和样本标签张量;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内蒙古大学,未经内蒙古大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010544102.5/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top