[发明专利]利用神经网络识别图片的方法及装置、介质和计算设备有效
| 申请号: | 201810905961.5 | 申请日: | 2018-08-09 |
| 公开(公告)号: | CN109255369B | 公开(公告)日: | 2020-10-16 |
| 发明(设计)人: | 徐国智;章煜彬;丛林;温翔;李晓燕;朱浩齐 | 申请(专利权)人: | 杭州易现先进科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06N3/04;G06N3/08;G06Q30/02 |
| 代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 杨静 |
| 地址: | 311200 浙江省杭州*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 利用 神经网络 识别 图片 方法 装置 介质 计算 设备 | ||
1.一种利用神经网络识别图片的方法,其中,所述神经网络的隐含层中至少包括全局隐含层和视觉注意力层,所述全局隐含层用于提取图片的全局特征,所述视觉注意力层用于提取图片的局部特征,所述方法包括:
获取图片数据;
将所述图片数据输入所述神经网络,在传输到所述全局隐含层的情况下,输出所述图片的全局特征;
将所述图片的全局特征输入所述视觉注意力层,并输出所述图片的局部特征;
根据所述图片的局部特征确定所述图片是否携带有特定信息;
确定所述图片的通道数量;
在所述图片的通道数量为多个的情况下,对所述图片的全局特征进行压缩,得到所述图片的单通道全局特征;以及
将所述图片的单通道全局特征输入所述视觉注意力层,并输出所述图片的局部特征。
2.根据权利要求1所述的方法,其中,在将所述图片数据输入所述神经网络之前,所述方法还包括:
将所述图片的尺寸调整至预设尺寸,以实现对所述图片进行预处理。
3.根据权利要求1所述的方法,其中,对所述图片的全局特征进行压缩,得到所述图片的单通道全局特征包括:
获取所述图片的各个局部区域在所述图片中的位置信息;
将属于同一位置的不同通道上的特征点的特征值与预设卷积核作卷积,得到不同通道上属于同一位置的卷积值;以及
将所述不同通道上属于同一位置的卷积值进行加和,得到的加和结果作为所述图片的单通道全局特征。
4.根据权利要求3所述的方法,其中,将所述图片的单通道全局特征输入所述视觉注意力层时,所述方法包括:
将所述图片的单通道全局特征与所述视觉注意力层的权重参数相乘,得到的结果作为所述图片的局部特征,其中,所述视觉注意力层的权重参数用于增强所述图片的局部特征的明显性。
5.一种神经网络训练方法,其中,所述神经网络的隐含层中至少包括全局隐含层和视觉注意力层,所述全局隐含层用于提取图片的全局特征,所述视觉注意力层用于提取图片的局部特征,所述方法包括:
获取图片样本数据,其中,所述图片样本数据至少包括携带有特定信息的图片的数据;
将所述图片样本数据中每一张图片的数据输入所述神经网络,以训练所述全局隐含层;以及
基于训练所述全局隐含层时输出的图片的全局特征,训练所述视觉注意力层;
其中,基于训练所述全局隐含层时输出的图片的全局特征,训练所述视觉注意力层包括在所述图片的通道数量为多个的情况下,对所述图片的全局特征进行压缩,得到所述图片的单通道全局特征;以及基于所述图片的单通道全局特征训练所述视觉注意力层。
6.根据权利要求5所述的方法,其中,基于训练所述全局隐含层时输出的图片的全局特征,训练所述视觉注意力层包括:
在所述图片的通道数量为多个的情况下,对所述图片的全局特征进行压缩,得到所述图片的单通道全局特征;以及
基于所述图片的单通道全局特征训练所述视觉注意力层。
7.根据权利要求6所述的方法,其中,所述神经网络至少还包括第一全连接层、第二全连接层和激活层,基于所述图片的单通道全局特征训练所述视觉注意力层包括:
将所述图片的单通道全局特征输入所述第一全连接层,输出第一全连接特征;
将所述第一全连接特征输入所述第二全连接层,输出第二全连接特征;
将所述第二全连接特征输入所述激活层,输出激活后的全局特征;以及
基于所述激活后的全局特征训练所述视觉注意力层,其中,所述视觉注意力层的权重参数用于增强图片的局部特征的明显性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州易现先进科技有限公司,未经杭州易现先进科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810905961.5/1.html,转载请声明来源钻瓜专利网。





