[发明专利]文字识别、编改的方法有效
| 申请号: | 201010253563.3 | 申请日: | 2010-08-16 |
| 公开(公告)号: | CN101887519A | 公开(公告)日: | 2010-11-17 |
| 发明(设计)人: | 瞿洋;袁仁慧;梁洵;张振海 | 申请(专利权)人: | 同方知网(北京)技术有限公司 |
| 主分类号: | G06K9/20 | 分类号: | G06K9/20;G06F17/21 |
| 代理公司: | 北京捷诚信通专利事务所(普通合伙) 11221 | 代理人: | 魏殿绅 |
| 地址: | 100084 北京市海淀区清华园清华*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文字 识别 方法 | ||
1.文字识别、编改的方法,其特征在于,所述方法包括
选用不同的识别软件并采用外挂的方式对文档中的文字进行识别;
比对所识别文字的结果;
将识别不同的文字进行编改校对并进行质检;
将质检合格后的文字合成文档并输出。
2.根据权利要求1所述的文字识别、编改的方法,其特征在于,所述识别软件至少包含两种,其识别软件可采用“汉王”OCR识别软件和“文通”OCR识别软件进行外挂识别。
3.根据权利要求1所述的文字识别、编改方法,其特征在于,所述文字的编改包括纵向编改和横向编改。
4.根据权利要求2所述的文字识别、编改的方法,其特征在于,所述“汉王”OCR识别软件和“文通”OCR识别软件为两种识别结果互补的识别软件。
5.根据权利要求1所述的文字识别、编改的方法,其特征在于,在执行“选用不同的识别软件并采用外挂的方式对文档中的文字进行识别”之前还包括以下步骤:
对文档进行扫描并进行相应的处理;
对文档图像进行段落切图;
通过识别软件对切好的段落图像进行自动版面分析并检查其分析的结果。
6.根据权利要求1~5任一项所述的文字识别、编改的方法,其特征在于,所述识别还包括对英文及其他字符的识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同方知网(北京)技术有限公司,未经同方知网(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010253563.3/1.html,转载请声明来源钻瓜专利网。





