[发明专利]一种结合注意力机制的多尺度图像压缩重构方法在审
申请号: | 202210688641.5 | 申请日: | 2022-06-17 |
公开(公告)号: | CN114926557A | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 刁梓键 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06T9/00 | 分类号: | G06T9/00;G06F17/16 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 郑堪泳 |
地址: | 510090 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结合 注意力 机制 尺度 图像 压缩 方法 | ||
1.一种结合注意力机制的多尺度图像压缩重构方法,其特征在于,包括以下步骤:
S1:获取待重构的图像,构建多尺度重构模型;
所述多尺度重构模型包括采样模块,初始重构模块和加强重构模块;
S2:在采样模块中对待重构的图像进行卷积采样得到测量值,并进行测量值调整;
S3:在初始重构模块中对调整后的测量值进行初始重构,得到初始重构值,并计算测量值残差;
S4:在加强重构模块中对初始重构值进行多尺度重构,得到加强重构值,并根据测量值残差计算补偿重构值;
S5:根据初始重构值、加强重构值和补偿重构值得到重构图像。
2.根据权利要求1所述的一种结合注意力机制的多尺度图像压缩重构方法,其特征在于,在对待重构的图像进行卷积采样前,还包括对待重构的图像分块,切成若干像素为33×33的图像块;
所述卷积采样具体为:
y=S(x)=WM*x=Wx
其中,y表示采样得到的测量值,S()表示采样的映射过程,x表示输入的图像,WM表示卷积核组,m=r×N2表示卷积核的个数,r表示采样率,N表示图像块大小;
W表示由卷积核组构成的网络参数矩阵,具体为:
w1,w2,w3,wm分别表示网络参数矩阵中第一个卷积核、第二个卷积核、第三个卷积核、第m个卷积核,R表示实数。
3.根据权利要求2所述的一种结合注意力机制的多尺度图像压缩重构方法,其特征在于,在步骤S2中,测量值调整包括以下步骤:
S2.1:对测量值进行全局平均池化处理:
y1=avgpolling(y)
S2.2:通过一维卷积进行测量值信息交互:
y2=conv1d(y1)
S2.3:采用sigmoid函数进行权重分配:
β=sigmoid(y2)
S2.4:进行归一化处理:
β1=softmax(β)
S2.5:调整测量值:
其中,y1表示全局平均池化处理后的测量值,y2表示y1经过一维卷积后的值,表示权重,β1表示归一化后的权重,yf表示调整后的测量值。
4.根据权利要求3所述的一种结合注意力机制的多尺度图像压缩重构方法,其特征在于,所述初始重构表示为:
x1=IR(yf)=Wint*yf
其中,x1为初始重构值,IR()为初始重构函数,Wint为用于初始重构的卷积层。
5.根据权利要求4所述的一种结合注意力机制的多尺度图像压缩重构方法,其特征在于,通过以下公式计算测量值残差:
△y=yf-W*x1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210688641.5/1.html,转载请声明来源钻瓜专利网。