[发明专利]实现任意方向书写文本行切分的方法及系统有效
| 申请号: | 201410038222.2 | 申请日: | 2014-01-26 |
| 公开(公告)号: | CN104809483B | 公开(公告)日: | 2019-04-05 |
| 发明(设计)人: | 胡金水;竺博;王智国;胡郁;刘庆峰 | 申请(专利权)人: | 科大讯飞股份有限公司 |
| 主分类号: | G06K9/68 | 分类号: | G06K9/68;G06K9/00 |
| 代理公司: | 北京维澳专利代理有限公司 11252 | 代理人: | 王立民;吉海莲 |
| 地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 实现 任意 方向 书写 文本 切分 方法 系统 | ||
本发明涉及手写识别技术领域,公开了一种实现任意方向书写文本行切分的方法及系统。该方法包括:将连续笔迹切分为文本片断序列;根据所述文本片断序列中两相邻文本片断的合并概率对所述文本片断序列进行合并处理;获取合并处理完成后的文本片断序列,并将其作为有效文本行序列;将所述有效文本行序列中的各文本片断独立成行。本发明可以在提高文本行切分准确率的同时,实现对用户书写区域内的任意方向随意写的支持。
技术领域
本发明涉及手写识别技术领域,具体涉及一种实现任意方向书写文本行切分的方法及系统。
背景技术
作为一种简单方便而又高效的输入方式,手写识别改变了传统的基于复杂编码或拼音输入的键盘模式,为自然人性的人机交互提供了便利条件。近年来,随着各种信息技术的迅猛发展,手写识别应用迎来了大屏幕触摸屏时代,有力地支撑了手写识别软件市场的发展,同时也对识别技术提出了新的要求和挑战。大屏幕设备为用户提供了更优的手写输入模式,允许用户以在线全屏多行手写输入识别方式完成输入。
实现多行手写输入的识别系统通常首先需要将用户输入的文字段切分成单行数据,随后将得到的文本行序列依次入单行连续手写识别引擎进行字符识别或解码。显然文本行切分的准确率对提高多行手写识别系统识别结果的正确性有着重要影响。
传统的文本行切分系统主要基于对连续笔迹的横纵轴投影直方图的分析,具体过程如下:
1.将文本段的笔迹分别向横轴和纵轴进行灰度投影;
2.对所得的横、纵轴灰度投影图分别分析,获取投影直方图包络的各波谷信息;
3.检测整个笔迹波形的特征,如波峰值,波谷长度等,确认所述波形包络波谷作为文本行空白的可能性,进而实现对多行书写字符的切分。
图1展示了对文本行“近几”“年来”的笔迹在纵轴上的投影直方图。从图上可以看到直方图包络存在明显的波谷信息,正对应文本行“近几”“年来”的行间空白区。
图2展示了基于直方图包络的文本行切分过程。具体地,系统首先获取图中线条21所示的直方图包络,随后根据该包络的最大波峰Max及最低波谷Min确定波峰波谷的阈值线,所述阈值定义为X=β1*Max+β2*Min(如线条22所示,β1,β2为系统预设的参数)。最后系统在波谷区域搜索全局最小波谷点,如线条23所示,即为文本行切分点。
现有的基于笔迹点投影直方图的方法仅能支持按照特定预设书写方向书写的文本行的切分,如从左到右或从上至下等标准逐行书写方式。该方法对其它更为自由的书写方式,如按照任意角度方向输入或每行书写方向都不一致的书写则无法进行有效切分,而且其切分准确率和实用性尚存在一定差距。
发明内容
本发明实施例提供一种实现任意方向书写文本行切分的方法及系统,在提高文本行切分准确率的同时,实现对用户书写区域内的任意方向随意写的支持。
本发明实施例提供一种实现任意方向书写文本行切分的方法,包括:
根据连续笔迹中相邻样本点间的位置偏移度将连续笔迹切分为文本片断序列;
根据所述文本片断序列中两相邻文本片断的合并概率与预设的合并门限的关系,对所述文本片断序列进行合并处理;
获取合并处理完成后的文本片断序列,并将其作为有效文本行序列;
将所述有效文本行序列中的各文本片断独立成行。
优选地,所述文本片断序列包括以下任意一种或多种:单行数据、具有空白间隔的词组数据、单个字词。
优选地,所述将连续笔迹切分为文本片断序列包括:
依次计算所述连续笔迹中各样本点的位置偏移度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410038222.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于类脑协处理器的计算机系统
- 下一篇:一种基于SVM的食物分类识别方法





