[发明专利]一种识别手写文本行语言类别的方法及装置无效
| 申请号: | 201110080818.5 | 申请日: | 2011-03-31 |
| 公开(公告)号: | CN102156889A | 公开(公告)日: | 2011-08-17 |
| 发明(设计)人: | 郭育生 | 申请(专利权)人: | 汉王科技股份有限公司 |
| 主分类号: | G06K9/72 | 分类号: | G06K9/72;G06F3/041 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100193 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 识别 手写 文本 语言 类别 方法 装置 | ||
技术领域
本发明属于输入法技术领域,涉及一种识别手写文本行语言类别的方法,特别是涉及一种识别手写文本行语言类别的方法及装置。
背景技术
随着移动终端和触控技术的发展,手写技术以其方便、快速的优势得到了更加广泛的应用。对手写文本的识别也逐步从单个字符的识别发展到文本行的识别,中文和英文两种语言类别的文本行识别是目前应用最多的。
现有的大部分手写文本行识别技术中,通过在一个终端上加载不同的识别语言包来实现特定语言的手写文本行输入,该方法无法在同一个终端上识别多种语言的手写文本行,当需要识别其他语言的手写文本行时,需要首先卸载当前识别语言包,然后,再安装另一种识别语言包,使用起来非常不方便。一种改进的手写文本行识别技术的应用是同时加载多个识别语言包,进行手写文本行识别之前,首先指定手写文本行的语言类别,在用户完成文本行的输入后,只能按照指定的语言类别对输入的文本行进行识别。这种应用,要求使用者在每次输入不同语言类别的文本行之前,首先设置识别的文本行的语言类别,用户使用起来也非常不方便,也影响输入的速度。
发明内容
本发明的目的在于提供一种识别手写文本行语言类别的方法及装置,能够自动识别手写文本行语言类别,在进行手写文本行识别之前,不需要用户手动设置手写文本行的识别范围,方便用户进行多语言的文本行输入,也提高了输入的速度。
本发明提供了如下方案:
一种识别手写文本行语言类别的方法,包括:
获取手写文本行,将手写文本行分割成多个笔划几何块;
分别提取每个笔划几何块的特征,根据提取的特征计算所述笔划几何块的预设语言可信度;
根据获得的多个笔划几何块的预设语言可信度,识别所述手写文本行的语言类别。
优选的,所述将手写文本行分割成多个笔划几何块,包括:从手写文本行的笔迹数据中提取所有笔划,并将每个笔划初始化为相应的笔划块;通过合并水平投影重叠的笔划块,将多个笔划块合并成至少一个笔划几何块。所述笔迹数据包括构成笔划的笔迹点坐标和笔划结束标志,所述笔划几何块包括至少一个笔划。
优选的,所述合并水平投影重叠的笔划块,将多个笔划块分割成至少一个笔划几何块,包括:
S1、依序取两个相邻的笔划块;
S2、判断所述两个相邻的笔划块的水平投影是否重叠,如果重叠,将所述两个相邻的笔划块合并为合并笔划块;
S3、依序取与所述合并笔划块相邻的笔划块,并判断所述合并笔划块和该相邻的笔划块的水平投影是否重叠,如果重叠,将所述合并笔划块和该相邻的笔划块合并为另一合并笔划块,重复S3;否则,所述合并笔划块形成一个笔划几何块,转至S1;
S4、重复步骤S3,直至所有笔划块合并完成;
其中,所述合并笔划块包括至少两个笔划的笔划块。
所述相邻笔划块指按笔划书写顺序相邻的笔划块。
优选的,在所述合并笔划块和与其相邻的笔划块的笔划四周分别沿水平方向和垂直方向绘制线条形成一个四边形区域,该四边形区域包括:上边框、下边框、左边框和右边框;
其中,所述上边框通过笔划块中的笔划笔迹点中位于最顶侧的笔迹点沿水平方向绘制线条形成,所述下边框通过沿笔划块中的笔划笔迹点中位于最底侧的笔迹点沿水平方向绘制线条形成,所述左边框通过沿笔划块中的笔划笔迹点中位于最左侧的笔迹点沿垂直方向绘制线条形成,所述右边框通过沿笔划块中的笔划笔迹点中位于最右侧的笔迹点沿垂直方向绘制线条形成。
其中,所述两个相邻的笔划块包括第一笔划块和第二笔划块;
判断两个相邻的笔划块的水平投影是否重叠时,若第一笔划块的左边框在第二笔划块的右边框的左侧且第一笔划块的右边框在第二笔划块的左边框的右侧,则该两个笔划块的水平投影重叠。
优选的,所述预设语言包括:中文、日文和韩文,所述笔划几何块的特征包括:预设语言字符识别可信度、高宽比、笔迹点密度和笔划数。
优选的,所述第 个笔划几何块的预设语言可信度通过公式计算得到,其中,所述表示第k个特征的权重,满足条件,所述表示笔划几何块的第k个特征的特征值。
优选的,所述根据获得的多个笔划几何块的预设语言可信度,识别所述手写文本行的语言类别,包括:根据多个笔划几何块的预设语言可信度,获得该手写文本行的预设语言可信度;根据手写文本行的预设语言可信度识别所述手写文本行的语言类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汉王科技股份有限公司,未经汉王科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110080818.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:PTC加热器的铝管
- 下一篇:γ-分泌酶的吡啶基调节剂





