[发明专利]一种自动化发票验真方法及系统有效
申请号: | 201810375901.7 | 申请日: | 2018-04-25 |
公开(公告)号: | CN108734849B | 公开(公告)日: | 2020-11-13 |
发明(设计)人: | 郝双 | 申请(专利权)人: | 新浪网技术(中国)有限公司 |
主分类号: | G07D7/20 | 分类号: | G07D7/20 |
代理公司: | 北京卓岚智财知识产权代理事务所(特殊普通合伙) 11624 | 代理人: | 任漱晨 |
地址: | 100193 北京市海淀区东北旺西路中关村*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动化 发票 方法 系统 | ||
1.一种自动化发票验真方法,其特征在于,包括:
获取待验证发票的原始图像;
提取所述原始图像上具有固定位置的特定标识的参数信息;所述特定标识的参数信息包括所述特定标识的位置边界点坐标、宽度及高度;
根据所述特定标识的参数信息,对所述原始图像进行粗分割,得到右上子图和右下子图;所述右上子图上的图片信息包括发票代码、发票号码及开票日期,所述右下子图上的图片信息包括税前金额;
分别对所述右上子图和右下子图进行版面分析,得到发票四要素的区域坐标,所述四要素包括发票代码、发票号码、开票日期及税前金额;
根据所述四要素的区域坐标,从所述原始图像上截取对应的四要素子图;
调用开源光学字符识别引擎,通过所述开源光学字符识别引擎分别对四要素子图进行光学字符识别,得到对应的四要素信息;
将所述四要素信息发送至税务接口,通过所述税务接口对所述待验证发票进行真假验证;
所述根据所述特定标识的参数信息,对所述原始图像进行粗分割,得到右上子图和右下子图,具体包括:
根据所述特定标识的位置边界点坐标、宽度及高度,分别确定所述右上子图和右下子图的边界点坐标;
根据所述右上子图的边界点坐标,对所述原始图像进行截取,得到右上子图;以及根据所述右下子图的边界点坐标,对所述原始图像进行截取,得到右下子图。
2.根据权利要求1所述的自动化发票验真方法,其特征在于,所述提取所述原始图像上具有固定位置的特定标识的参数信息,具体包括:
对所述原始图像进行R、G、B三通道分离,得到对应的R通道图片、G通道图片及B通道图片;
根据所述R通道图片、G通道图片及B通道图片,从原始图像中提取图片红色信息,得到红色信息图;
按照设定比例,分别对所述红色信息图、R通道图片、G通道图片及B通道图片进行截取,获得对应的部分红色信息图、部分R通道图片、部分G通道图片及部分B通道图片;
根据所述部分R通道图片、部分G通道图片及部分B通道图片,在所述部分红色信息图中确定特定标识区域;
根据所述特定标识区域,确定所述特定标识的位置边界点坐标、宽度及高度。
3.根据权利要求1所述的自动化发票验真方法,其特征在于,所述分别对所述右上子图和右下子图进行版面分析,得到发票四要素的区域坐标,具体包括:
对所述右上子图做蓝色二值化处理,得到第一蓝色二值化图像;
对所述第一蓝色二值化图像进行行投影,得到第一行投影图;其中,第一分割线位于所述第一行投影图中第一行与第二行之间,第二分割线位于所述第一行投影图像中第二行与第三行之间;
对所述第一蓝色二值化图像进行列投影,得到第一列投影图;第三分割线位于所述第一列投影图中最宽波谷处的中心;
根据所述第一分割线、第二分割线及第三分割线,对所述第一蓝色二值化图像进行分割,得到一个发票代码、两个发票号码及一个开票日期的区域坐标;
对所述右下子图做蓝色二值化处理,得到第二蓝色二值化图像;
对所述第二蓝色二值化图像进行行投影,得到第二行投影图,从所述第二行投影图中选择最宽的一行;
对所述第二蓝色二值化图像进行列投影,得到第二列投影图;其中,第四分割线位于所述第二列投影图中最宽波谷处的中心;
根据选择的最宽的一行及第四分割线,对所述第二蓝色二值化图像进行分割,得到税前金额的区域坐标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新浪网技术(中国)有限公司,未经新浪网技术(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810375901.7/1.html,转载请声明来源钻瓜专利网。