[发明专利]一种电厂两票系统PDF文档识别文字方法在审
申请号: | 202011370942.0 | 申请日: | 2020-11-30 |
公开(公告)号: | CN112487970A | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 甘祎扬;胡雅琴;李善文;张旭刚;邓铭祺;陈思萱;黄斌;刘小波;杨威;阮班义;严一凡;张小平;周鹏杰;徐广伟;秦文红;李宏远;熊亦正;潘悦;王智;朱春良;鲁普天;熊震 | 申请(专利权)人: | 国网江西省电力有限公司检修分公司;国家电网有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32 |
代理公司: | 江西省专利事务所 36100 | 代理人: | 张文 |
地址: | 330096 江西省南昌*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种电厂两票系统PDF文档识别文字方法,该方法先是票据图像预处理,再利用预先通过信息区域训练自学习而构建的信息区域特征数据库,对经过预处理的PDF文档进行信息区域识别;边界和底纹处理,包括对所识别的信息区域进行重叠区域合并、去除底纹干扰、突出字符颜色以及二值化处理;加密/解密PDF文档;从PDF和XFDF的格式中导入或导出表单数据;向已有的PDF文档中追加内容,将一个PDF文档切分为多个文档,覆盖原PDF文档;排序sort为true后,PDF按行读取,保持顺序,最后保存PDF文档。本发明能够以良好的准确率和适应性自动地识别和提取两票数据信息,从而节省票据处理的人力和时间。 | ||
搜索关键词: | 一种 电厂 系统 pdf 文档 识别 文字 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网江西省电力有限公司检修分公司;国家电网有限公司,未经国网江西省电力有限公司检修分公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011370942.0/,转载请声明来源钻瓜专利网。