[发明专利]在光学字符识别(OCR)过程中的段落识别有效
| 申请号: | 201180013187.3 | 申请日: | 2011-03-08 |
| 公开(公告)号: | CN102782702A | 公开(公告)日: | 2012-11-14 |
| 发明(设计)人: | B.拉达科维奇;S.加利奇;A.乌泽拉奇 | 申请(专利权)人: | 微软公司 |
| 主分类号: | G06K9/03 | 分类号: | G06K9/03;G06K9/20;G06K19/06 |
| 代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 李舒;汪扬 |
| 地址: | 美国华*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 用于检测在文本图像中的段落的图像处理设备包括:输入部件,用于接收其中文本行和单词已被标识的输入图像;和页分类部件,用于把输入图像分类为第一或第二页类型。该设备还包括段落检测部件,用于把在输入图像上的所有文本行分类为开始段落行或继续段落行。设备还被提供有段落创建部件,用于创建包括两个连续的开始段落行之间的文本行,包括所述两个连续的开始段落行的第一个开始段落行的段落。已被识别的段落可以通过它们呈现的对齐的类型而被分类。例如,段落可以按照它们是左对齐、右对齐、居中对齐还是两端对齐而进行分类。 | ||
| 搜索关键词: | 光学 字符 识别 ocr 过程 中的 段落 | ||
【主权项】:
一种用于检测在文本图像中的段落的图像处理设备,包括:输入部件,用于接收其中文本行和单词已被标识的输入图像;页分类部件,用于把输入图像分类为第一或第二页类型;段落检测部件,用于把在输入图像上的所有文本行分类为开始段落行或继续段落行;以及段落创建部件,用于创建包括两个连续的开始段落行之间的文本行,包括所述两个连续的开始段落行的第一个开始段落行的段落。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201180013187.3/,转载请声明来源钻瓜专利网。





