[发明专利]图像信息提取方法和装置有效
| 申请号: | 201810523909.3 | 申请日: | 2018-05-28 |
| 公开(公告)号: | CN109034159B | 公开(公告)日: | 2021-05-28 |
| 发明(设计)人: | 伍更新;高大帅;李健;张连毅;武卫东 | 申请(专利权)人: | 北京捷通华声科技股份有限公司 |
| 主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62 |
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100193 北京市海淀区东北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图像 信息 提取 方法 装置 | ||
本发明提供了一种图像信息提取方法和装置,该方法包括:离线训练基于深度学习算法的预设模型,其中,预设模型包括文本行检测模型、文本行识别模型、证件分类模型;采集证件文本的电子图像;将预设模型加载至AI芯片上;将电子图像输入至预设模型中的每个模型;控制AI芯片运行证件分类模型以对电子图像进行证件分类,确定电子图像的证件类型;控制AI芯片依次运行文本行检测模型和文本行识别模型以对电子图像进行文本识别,确定电子图像的不同位置的文本行的内容信息;按照预设算法对不同位置的文本行的内容信息进行识别处理,确定电子图像的结构化信息;输出电子图像的证件类型及结构化信息。本发明提升图像信息的提取实时性、准确率、鲁棒性。
技术领域
本发明涉及图像处理技术领域,特别是涉及一种图像信息提取方法和装置。
背景技术
目前,在各种场景下普遍需要将证件、票据等信息录入到计算机中;其中,信息的人工录入步骤繁杂,成本较高且错误率较高。目前主要的录入方式是基于OCR(光学字符识别技术)的信息提取和录入。
OCR信息提取流程具体包括:
步骤一,文本图像采集:采用图像采集设备获取待录入的文本图像(例如身份证的电子图像);
步骤二,文本行定位:使用传统图像处理算法(例如图像滤波、图像二值化等)对采集到的文本图像进行倾斜校正、文字聚类生成文本行;
步骤三,文本识别:使用传统gabor或hog特征进行文字识别;
步骤四,后处理:根据识别结果进行图像的证件分类和信息提取。
其中,步骤二中的子步骤繁多,且每个子步骤中涉及的参数较多,各个子步骤需要认真调节参数才能得到较好的定位结果,因此,鲁棒性较差。而步骤三中的基于gabor和hog特征的识别算法对文字的识别准确率较低。
由此可见,现有技术中的图像信息提取方案普遍存在着信息提取准确率低以及鲁棒性差的问题。
发明内容
本发明提供了一种图像信息提取方法和装置,以解决现有技术中的图像信息提取方案所存在的信息提取准确率低以及鲁棒性差的问题。
为了解决上述问题,第一方面,本发明实施例提供了一种图像信息提取方法,所述方法包括:
根据训练样本离线训练基于深度学习算法的预设模型,其中,所述预设模型包括文本行检测模型、文本行识别模型、证件分类模型;
采集证件文本的电子图像;
将预先经过训练的所述预设模型加载至AI芯片上;
将所述电子图像输入至所述预设模型中的每个模型;
控制所述AI芯片运行所述证件分类模型以对所述电子图像进行证件分类,确定所述电子图像的证件类型;
控制所述AI芯片依次运行所述文本行检测模型和所述文本行识别模型以对所述电子图像进行文本识别,确定所述电子图像的不同位置的文本行的内容信息;
按照预设算法对所述不同位置的文本行的内容信息进行识别处理,确定所述电子图像的结构化信息;
输出所述电子图像的证件类型及所述结构化信息。
第二方面,本发明实施例还提供了一种图像信息提取装置,所述图像信息提取装置包括AI芯片和预先经过训练的预设模型,所述图像信息提取装置还包括:
训练模块,用于根据训练样本离线训练基于深度学习算法的预设模型,其中,所述预设模型包括文本行检测模型、文本行识别模型、证件分类模型;
图像采集模块,用于采集证件文本的电子图像;
加载模块,用于将预先经过训练的所述预设模型加载至AI芯片上;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声科技股份有限公司,未经北京捷通华声科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810523909.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





