[发明专利]图像的比对方法、装置、存储介质及电子装置有效
| 申请号: | 201910242869.X | 申请日: | 2019-03-28 |
| 公开(公告)号: | CN110009027B | 公开(公告)日: | 2022-07-29 |
| 发明(设计)人: | 赵安元;李洋 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06V10/75 | 分类号: | G06V10/75;G06V10/74;G06V10/46;G06K9/62;G06N3/08 |
| 代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 周婷婷 |
| 地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图像 方法 装置 存储 介质 电子 | ||
1.一种图像的比对方法,其特征在于,包括:
使用具有对应关系的参照图像和样本图像对初始神经网络模型的参数进行训练,得到目标神经网络模型,其中,所述初始神经网络模型包括串联的多个层级,所述多个层级中的每一个层级依次包括卷积层和池化层,所述多个层级中的每一个层级中的卷积层包括多个卷积核,用于抽取关键特征与非关键特征的卷积核对应的参数权重在所述初始神经网络模型的训练过程中被动态调整,所述关键特征为图像中的字符包括的关键笔画所具有的特征,所述非关键特征为图像中的字符所具有的除所述关键特征之外的特征;
在显示界面上显示目标参照图像;通过图像采集装置对目标区域输入的信息进行拍照以得到输入图像;建立所述目标参照图像与所述输入图像之间的对应关系,其中,所述输入图像用于指示对照所述目标参照图像在所述目标区域上输入的信息,所述参照图像包括所述目标参照图像;
通过所述目标神经网络模型从所述目标参照图像中提取目标字符的第一笔画特征和第二笔画特征;将所述第一笔画特征与所述第二笔画特征的加权和确定为第一字符特征,其中,所述第一笔画特征对应第一权重值,所述第二笔画特征对应第二权重值,所述第一笔画特征为所述目标字符的关键特征,所述第二笔画特征为所述目标字符所具有的除所述第一笔画特征的非关键特征,所述第一笔画特征所对应的第一权重值高于所述第二笔画特征所对应的第二权重值;
通过所述目标神经网络模型从所述输入图像中提取输入字符的第三笔画特征和第四笔画特征;将所述第三笔画特征与所述第四笔画特征的加权和确定为第二字符特征,其中,所述输入字符为对照所述目标参照图像在所述目标区域上输入的字符信息,所述第三笔画特征为所述输入字符的关键特征,所述第四笔画特征为所述输入字符所具有的除所述第三笔画特征之外的非关键特征;
对包括所述第一字符特征的第一特征,与包括所述第二字符特征的第二特征进行比对,得到比对结果,其中,所述比对结果用于指示所述目标参照图像与所述输入图像之间的相似度;
所述使用具有对应关系的所述参照图像和所述样本图像对所述初始神经网络模型的参数进行训练,包括:
使用所述初始神经网络模型中的第一卷积神经网络模型用n个不同的特征视野对所述参照图像做卷积操作,得到第一个卷积层的结果,其中,所述第一个卷积层的结果包括被映射成的n个第一特征图;对所述n个第一特征图进行池化操作,得到第一池化层;对所述第一池化层的每一层用m个不同的特征视野做卷积操作,得到n×m层的第一目标特征图,其中,所述第一目标特征图为用计算机语言描述的所述参照图像的特征;
使用所述初始神经网络模型中的第二卷积神经网络模型用n个不同的特征视野对所述样本图像做卷积操作,得到第二个卷积层的结果,其中,所述第二个卷积层的结果包括被映射成的n个第二特征图;对所述n个第二特征图进行池化操作,得到第二池化层;对所述第二池化层的每一层用m个不同的特征视野做卷积操作,得到n×m层的第二目标特征图,其中,所述第二目标特征图为用计算机语言描述的所述样本图像的特征,所述第一卷积神经网络模型与所述第二卷积神经网络模型为相同模型;
利用下述公式,对比所述第一目标特征图以及所述第二目标特征图的相似度:
其中,xi表示所述第一目标特征图里的每一个像素,yi表示手所述第二目标特征图里的每一个像素,d(x,y)就表示了两者之间的差异;
利用下述公式结合梯度下降算法,对所述初始神经网络模型的参数进行训练:
h(d(f(X),f(Y)))=score
其中,f表示卷积神经网络,d表示欧氏距离,h表示一个阈值区间的函数,score为将得到的d(f(X),f(Y))映射到所述一个阈值区间得到的对比度评分。
2.根据权利要求1所述的方法,其特征在于,获取所述目标参照图像的所述第一特征以及所述输入图像的所述第二特征包括以下之一:
从具有对应关系的参照图像和图像特征中查找与所述目标参照图像对应的所述第一特征,并将所述输入图像输入至所述目标神经网络模型,得到所述目标神经网络模型输出的所述第二特征,其中,所述图像特征是预先将所述参照图像输入至所述目标神经网络模型中得到的所述目标神经网络模型输出的特征;
将所述目标参照图像和所述输入图像分别输入至所述目标神经网络模型,得到所述目标神经网络模型输出的所述目标参照图像对象的所述第一特征以及所述输入图像对应的所述第二特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910242869.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于ID3算法的数据分类方法
- 下一篇:一种显微图像数据增强方法及装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





