[发明专利]一种包括周边环境的图像识别方法及装置有效
| 申请号: | 201910894420.1 | 申请日: | 2019-09-20 |
| 公开(公告)号: | CN110738213B | 公开(公告)日: | 2022-07-01 |
| 发明(设计)人: | 杜宇 | 申请(专利权)人: | 成都芯云微电子有限公司 |
| 主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V10/44;G06V10/46;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京之于行知识产权代理有限公司 11767 | 代理人: | 何志欣 |
| 地址: | 611730 四川省成都市郫都区德源镇*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 包括 周边环境 图像 识别 方法 装置 | ||
1.一种包括周边环境的图像识别方法,其特征在于,所述方法至少包括以下步骤:
基于卷积层提取图像矩阵;
将所述图像矩阵进行至少一次缩边处理;
将缩边处理后的图像矩阵进行至少一次非缩边的残差处理;
基于全连接层输出识别的图像数据;
所述方法还包括步骤:构建缩边模块;
所述缩边模块的缩边方法包括:基于所述卷积层提取图像矩阵的中间和/或边缘特征元素,去掉所述图像矩阵的边缘k层的特征元素,
缩边后,卷积层的卷积核的大小为:m=k*2+1,其中,m,k为正整数;
所述缩边模块包括基本缩边模块和瓶颈缩边模块,
所述基本缩边模块至少包括两层m*m卷积层,
所述基本缩边模块的缩边方法包括:G(x)=conv_2(σ(conv_1(x)))+r(x),
其中,conv_1(x),conv_2(x)表示对图像矩阵x进行无padding的m*m卷积变换,m≥1;σ(x)表示对图像矩阵x进行非线性变换;r(x)表示对图像矩阵x进行缩边;
所述瓶颈缩边模块至少包括两层1*1卷积层和一层m*m卷积层,其中m*m卷积层设置在两个1*1卷积层之间,
所述瓶颈缩边模块的缩边方法包括:
G(x)=c_2(σ(conv(σ(c_1(x)))))+r(x)
其中,conv(x)表示对图像矩阵x进行无padding的m*m卷积变换,m>1;c_1(x)与c_2(x)表示对图像矩阵x进行1*1卷积变换,σ(x)表示对图像矩阵x进行非线性变换;r(x)表示对图像矩阵x进行缩边。
2.如权利要求1所述的包括周边环境的图像识别方法,其特征在于,所述r(x)去掉所述图像矩阵的边缘k层的特征元素的函数为:
即去掉原矩阵x的第1~k行,第1~k列,第(n-k+1)~n行和第(n-k+1)~n列。
3.如权利要求2所述的包括周边环境的图像识别方法,其特征在于,所述基本缩边模块的m*m卷积层为包含3x3卷积核的卷积层;
所述瓶颈缩边模块中的m*m卷积层为包含3x3卷积核的卷积层。
4.如权利要求3所述的包括周边环境的图像识别方法,其特征在于,所述方法还包括:在进行所述非缩边的残差处理之前或之中,将图像矩阵进行至少一次池化处理和/或卷积处理以改变通道数量。
5.一种包括周边环境的图像识别装置,其特征在于,所述装置至少包括:
卷积模块,用于基于卷积层提取图像矩阵;
缩边单元,用于将所述图像矩阵进行至少一次缩边处理;
残差单元,用于将缩边处理后的图像矩阵进行至少一次非缩边的残差处理;
全连接层模块,用于基于全连接层输出识别的图像数据,
其中,所述缩边单元设置在所述卷积模块与所述残差单元之间,所述残差单元与所全连接层模块连接;
所述缩边单元包括若干缩边模块;
所述缩边模块的缩边方法包括:基于所述卷积层提取图像矩阵的中间和/或边缘特征元素,去掉所述图像矩阵的边缘k层的特征元素,
缩边后,卷积层的卷积核的大小为:m=k*2+1,其中,m,k为正整数;
所述缩边模块包括基本缩边模块和瓶颈缩边模块,
所述基本缩边模块至少包括两层m*m卷积层,
所述基本缩边模块的缩边方法包括:G(x)=comv_2(σ(conv_1(x)))+r(x),其中,conv_1(x),conv_2(x)表示对图像矩阵x进行无padding的m*m,卷积变换,m>1;σ(x)表示对图像矩阵x进行非线性变换;r(x)表示对图像矩阵x进行缩边,
所述瓶颈缩边模块至少包括两层1*1卷积层和一层m*m卷积层,其中m*m卷积层设置在两个1*1卷积层之间,
所述瓶颈缩边模块的缩边方法包括:
G(x)=c_2(σ(conv(σ(c_1(x)))))+r(x)
其中,conv(x)表示对图像矩阵x进行无padding的m*m卷积变换,m≥1;c_1(x)与c_2(x)表示对图像矩阵x进行1*1积变换,σ(x)表示对图像矩阵x进行非线性变换;r(x)表示对图像矩阵x进行缩边。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都芯云微电子有限公司,未经成都芯云微电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910894420.1/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





