[发明专利]一种用于社会信用代码核查的字码抽取系统与方法有效
申请号: | 202110888928.8 | 申请日: | 2021-08-04 |
公开(公告)号: | CN113326674B | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 朱峰;章学周;吕浩;沈健威;吴杰;李玥;黄洁;赵文清;王理;徐雪岚;倪文红;孙芳;杨璐瑶;张莉 | 申请(专利权)人: | 江苏省质量和标准化研究院 |
主分类号: | G06F40/126 | 分类号: | G06F40/126;G06K9/00 |
代理公司: | 常州佰业腾飞专利代理事务所(普通合伙) 32231 | 代理人: | 陈红桥 |
地址: | 210029 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 社会 信用 代码 核查 字码 抽取 系统 方法 | ||
一种用于社会信用代码核查的字码抽取系统与方法,包括:外部系统和与外部系统通信连接的主控终端;数据解码模块运行在主控终端上;所述外部系统用于传递OFD文档至所述主控终端;所述数据解码模块用于从所述OFD文档中获得包含统一社会信用代码数据的信息;所述数据解码模块包括OFD文档解码单元、确认单元与操控单元;OFD文档解码单元,用于获得OFD文档页面内的各字码区的调制码一、字码的栅格图、内在数据与字型数据;有效避免了现有技术中数据解码模块从OFD文档中获得包含统一社会信用代码数据的信息中抓取文字耗时长、常发生导入出错、辨识率不佳的缺陷。
技术领域
本发明涉及字码抽取技术领域,具体涉及一种用于社会信用代码核查的字码抽取系统与方法。
背景技术
法人和其他组织统一社会信用代码制度,相当于让法人和其他组织拥有了一个全国统一的“身份证号”,标准规定统一社会信用代码用18位阿拉伯数字或大写英字码母表示,分别是1位登记管理部门代码、1位机构类别代码、6位登记管理机关行政区划码、9位主体标识码、1位校验码。由登记管理部门代码、机构类别代码、登记管理机关行政区划码、主体标识码(组织机构代码)和校验码五个部分组成,且对涉及到的组织机构、法人、其他组织、组织机构代码、统一社会信用代码等相应概念作出了规定。
在现有的社会信用代码数据核查模式中,普遍需要经由数据解码模块获得包含统一社会信用代码数据的信息,随后将包含统一社会信用代码数据的信息传递至核对数据库内,构造核对数据请求表;以此来进一步执行社会信用代码数据核查。包含统一社会信用代码数据的信息除了统一社会信用代码数据外,还包括法人或其他组织的名称、法人或其他组织的地址、法人或其他组织负责人的姓名这样的信息。
而数据解码模块获得包含统一社会信用代码数据的信息,往往是获得外部系统传送来的文档后,在传送来的文档中获得包含统一社会信用代码数据的信息。
另一方面,伴随着OFD版式文档的广泛运用,外部系统传来的文档也越来越多的是这样的OFD版式文档,OFD版式文档也就是OFD文档,OFD文档,就是版式文件的一种,它最大的特点在于,这是我国自主研发、自主制定的版式文档形式标准,其具有:
OFD文档内部运用可扩展标记语言XML来描述数据和结构,体积精简,安全开放,易于扩展;OFD支持国产加密算法,具有全面的安全保障体系,可防止信息被窃取,并且和数字签名技术结合,可防篡改抵赖,更加安全;永久可读可用,可对文件长久保存,且能够精准呈现,文件的版式内容在不一样场景、设备下都能保持一致性;OFD版式文档的标准,是由工业和信息化部软件司牵头中国电子技术标准化研究院成立的版式编写组制定的国家标准。
这样,数据解码模块从OFD文档中获得包含统一社会信用代码数据的信息,该获得为抽取出OFD文档内具有的字码数据,且经由规范的信息处置,把所述字码数据转变成宜于修改的文档形式,就像.wps这样的文档形式;现在,对OFD文档的字码抽取有二类模式,一类为运用抓取文字方式来把OFD文档转化为图片,需要说明的是就是运用抓取文字CaptureText软件来经由页面剖析、字段分割与字码辨识来把确认值导出,该模式的全部OFD文档的字码数据均要执行抓取文字CaptureText软件辨识,不光耗时长,也会发生导入出错,具有辨识率不佳的缺陷;另一类模式为运用OFD文档执行解码,抽取字码的调制码,然而在OFD文档内,具有字码的调制码与导出的字码不相符的现象发生,使得该模式抽取的字码不正确;就如,OFD文档形式规范说明了一些字型的调制码到单一码的关联,然而依然有一些OFD文档字型不能达成经字型的调制码到单一码的关联,因此字码的调制码与导出的字码不相符,辨识率不佳。
发明内容
为解决所述问题,本发明提供了一种用于社会信用代码核查的字码抽取系统和方法,有效避免了现有技术中数据解码模块从OFD文档中获得包含统一社会信用代码数据的信息中抓取文字耗时长、常发生导入出错、辨识率不佳的缺陷。
要克服现有技术中的不足,本发明提供了一种用于社会信用代码核查的字码抽取系统和方法的解决方案,具体如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏省质量和标准化研究院,未经江苏省质量和标准化研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110888928.8/2.html,转载请声明来源钻瓜专利网。