[发明专利]训练分类器的方法、装置、电子设备和计算机可读存储介质在审
申请号: | 201910421813.0 | 申请日: | 2019-05-20 |
公开(公告)号: | CN110222736A | 公开(公告)日: | 2019-09-10 |
发明(设计)人: | 卢永晨 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京竹辰知识产权代理事务所(普通合伙) 11706 | 代理人: | 陈龙 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 身份证图像 类别信息 训练分类器 分类器 集合 计算机可读存储介质 电子设备 卷积神经网络 身份证验证 输出项目 异常类别 正常类别 图像 应用 | ||
本公开公开了一种训练分类器的方法,其特征在于,包括:获取身份证图像集合,所述身份证图像集合中的身份证图像与类别信息对应,所述类别信息包括第一类别信息和第二类别信息,所述第一类别信息指示与所述第一类别信息对应的身份证图像的类别包括正常类别,所述第二类别信息指示与所述第一类别信息对应的身份证图像的类别包括异常类别;确定分类器的输出项目;根据所述身份证图像集合和卷积神经网络(CNN)训练所述分类器。本公开实施例提供的训练分类器的方法、装置、电子设备和计算机可读存储介质,能够根据身份证图像集合训练分类器,从而通过该分类器识别输入的图像是否为正常的身份证图像,以便应用于各种身份证验证场合。
技术领域
本公开涉及信息处理领域,尤其涉及一种训练分类器的方法、装置、电子设备及计算机可读存储介质。
背景技术
随着网络技术的进步,互联网已经成为服务于各种业务的重要媒介,例如通过互联网处理诸如银行业务等重要业务时,需要获取用户的身份证图像,从而通过身份证图像提取用户的身份信息以用于身份证验证,从而开展重要业务。
在上述验证过程中,现有技术往往通过识别设备和/或识别程序从用户上传的身份证图像中提取身份证图像区域,然后在身份证图像区域中根据预设位置提取用户的身份信息,例如姓名、生日、身份证有效期等。但是在上述过程中,发现部分用户上传的身份证图像存在许多问题,例如部分用户上传的身份证图像并不是身份证图像,或者由于光线或遮挡等原因、属于不清晰的身份证图像,或者是身份证的复印件图像等,识别设备和/或识别程序将从这些存在问题的身份证图像中可能无法提取身份信息,或者提取错误的身份信息,举例而言,当用户上传了其他证件的图像而非身份证图像时,识别设备和/或识别程序提取出该其他证件的图像区域,但是在身份证有效期的预设位置可能无法提取到身份证有效期信息,或者所提取的内容可能并不是正确的身份证有效期信息。
发明内容
本公开实施例提供的训练分类器的方法、装置、电子设备和计算机可读存储介质,能够根据身份证图像集合训练分类器,从而通过该分类器识别输入的图像是否为正常的身份证图像,以便应用于各种身份证验证场合。
第一方面,本公开实施例提供一种训练分类器的方法,其特征在于,包括:获取身份证图像集合,所述身份证图像集合中的身份证图像与类别信息对应,所述类别信息包括第一类别信息和第二类别信息,所述第一类别信息指示与所述第一类别信息对应的身份证图像的类别包括正常类别,所述第二类别信息指示与所述第一类别信息对应的身份证图像的类别包括异常类别;确定分类器的输出项目,所述输出项目包括第一输出项目和第二输出项目,所述第一输出项目与所述第一类别信息对应,所述第二输出项目与所述第二类别信息对应;根据所述身份证图像集合和卷积神经网络(CNN)训练所述分类器。
进一步的,所述分类器的输出项目的输出值的和为1。
进一步的,所述第二类别信息包括多个子类别信息;所述第二输出项目包括多个子输出项目,所述多个子输出项目与所述多个子类别信息对应。
进一步的,所述多个子类别信息包括如下中的一种或多种:指示虚假身份证图像类别的子类别信息;指示信息不全身份证图像类别的子类别信息;指示复印件身份证图像类别的子类别信息;指示非身份证的证件图像类别的子类别信息。
进一步的,在根据所述身份证图像集合和CNN训练所述分类器之后,还包括:接收输入图像;通过所述分类器确定与所述输入图像对应的输出项目的输出值;根据所述输入图像对应的输出项目的输出值确定所述输入图像的类别。
进一步的,在根据所述输入图像对应的输出项目的输出值确定所述输入图像的类别之后,还包括:在所述输入图像的类别为异常类别的情况下,生成异常指示信息。
进一步的,所述接收输入图像,包括从客户端接收所述输入图像;在生成所述异常指示信息之后,还包括:向所述客户端发送所述异常指示信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910421813.0/2.html,转载请声明来源钻瓜专利网。