[发明专利]实现任意方向书写文本行切分的方法及系统有效
| 申请号: | 201410038222.2 | 申请日: | 2014-01-26 |
| 公开(公告)号: | CN104809483B | 公开(公告)日: | 2019-04-05 |
| 发明(设计)人: | 胡金水;竺博;王智国;胡郁;刘庆峰 | 申请(专利权)人: | 科大讯飞股份有限公司 |
| 主分类号: | G06K9/68 | 分类号: | G06K9/68;G06K9/00 |
| 代理公司: | 北京维澳专利代理有限公司 11252 | 代理人: | 王立民;吉海莲 |
| 地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 实现 任意 方向 书写 文本 切分 方法 系统 | ||
1.一种实现任意方向书写文本行切分的方法,其特征在于,包括:
根据连续笔迹中相邻样本点间的位置偏移度,直接将连续笔迹切分为文本片断序列;
根据所述文本片断序列中两相邻文本片断的合并概率对所述文本片断序列进行合并处理;
获取合并处理完成后的文本片断序列,并将其作为有效文本行序列;
将所述有效文本行序列中的各文本片断独立成行。
2.根据权利要求1所述的方法,其特征在于,所述文本片断序列包括以下任意一种或多种:单行数据、具有空白间隔的词组数据、单个字词。
3.根据权利要求1所述的方法,其特征在于,所述直接将连续笔迹切分为文本片断序列包括:
依次计算所述连续笔迹中各样本点的位置偏移度;
选择所有位置偏移度大于设定的第一距离门限的样本点作为文本片断切分点,并将相邻切分点间的连续笔迹作为一个独立的文本片断,得到文本片断序列。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
预先设定系统距离门限;或者
根据当前输入的所有笔迹采样点距离实时确定所述第一距离门限。
5.根据权利要求1所述的方法,其特征在于,所述直接将连续笔迹切分为文本片断序列包括:
依次计算所述连续笔迹中各样本点的位置偏移度;
选择所有位置偏移度大于第二距离门限的样本点作为文本片断切分点,得到粗切分文本片断序列;
对所述粗切分文本片断序列中各文本片断进行细切分,得到文本片断序列。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
根据当前输入的所有笔迹采样点距离实时确定所述第二距离门限,具体包括:
确定当前输入笔迹中可能的字符大小;
将所述字符大小的整数倍作为所述第二距离门限。
7.根据权利要求6所述的方法,其特征在于,所述确定当前输入笔迹中可能的字符大小包括:
获取当前输入笔迹中各笔画;
确定各笔画占据区域的外边界;
根据所述外边界的高度和宽度,确定当前输入笔迹中可能的字符大小。
8.根据权利要求1所述的方法,其特征在于,所述根据所述文本片断序列中两相邻文本片断的合并概率对所述文本片断序列进行合并处理包括:
依次考察所述文本片断序列中的每个文本片断,考察过程如下:
计算待考察文本片断与其前一个文本片断的合并概率;
如果所述合并概率大于设定的合并门限,则将待考察文本片断与其前一个文本片断合并,并将合并后的文本片断作为下一个待考察文本片断的前一个文本片断。
9.根据权利要求1所述的方法,其特征在于,所述根据所述文本片断序列中两相邻文本片断的合并概率对所述文本片断序列进行合并处理包括:
依次考察所述文本片断序列中两相邻文本片断,考察过程如下:
计算所述两相邻文本片断的合并概率;
如果所述合并概率大于设定的合并门限,则将所述两相邻文本片断进行合并,否则保留原文本片断。
10.根据权利要求8或9所述的方法,其特征在于,按以下过程计算两相邻文本片断的合并概率:
分别计算两相邻文本片断各自的成行得分;
计算所述两相邻文本片断合并后的成行得分;
计算所述两相邻文本片断合并后的成行得分与所述两相邻文本片断各自的成行得分总和的差值,得到所述两相邻文本片断的合并概率。
11.根据权利要求10所述的方法,其特征在于,所述计算所述两相邻文本片断合并后的成行得分包括:
提取所述两相邻文本片断对应的连续笔迹特征;
根据所述连续笔迹特征计算所述两相邻文本片断合并后的成行得分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410038222.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于类脑协处理器的计算机系统
- 下一篇:一种基于SVM的食物分类识别方法





