[发明专利]一种基于特征融合的人像关键点检测方法及系统在审
| 申请号: | 202210648008.3 | 申请日: | 2022-06-09 |
| 公开(公告)号: | CN114863539A | 公开(公告)日: | 2022-08-05 |
| 发明(设计)人: | 林志贤;陈凯;林珊玲;郭太良;林坚普;叶芸;张永爱;周雄图 | 申请(专利权)人: | 福州大学 |
| 主分类号: | G06V40/16 | 分类号: | G06V40/16;G06N3/04;G06N3/08;G06V10/80;G06V10/82 |
| 代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 张灯灿;蔡学俊 |
| 地址: | 362251 福建*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 特征 融合 人像 关键 检测 方法 系统 | ||
1.一种基于特征融合的人像关键点检测方法,其特征在于,包括以下步骤:
步骤S1:将人像数据集中的图片送入轻量化人脸检测网络YOLOV5-n-face进行人脸检测并裁剪,摒弃背景多余信息,得到经过处理后的人像图片,将人像图片中的原有的坐标信息归一化后,通过高斯分布转化为热力图;
步骤S2:将步骤S1得到的人像图片送入基于Transformer和Convolution特征融合的回归网络对其进行训练,将步骤S1得到的热力图用于监督学习,损失函数采用自适应Wingloss;回归网络为并行结构,通过Convolution捕捉人像图片的低级语义特征,通过Transformer捕捉人像图片中的高级语义特征,将Convolution和Transformer得到的特征图进行跳跃连接,即通道相连,共同编码包含坐标信息的热力图;
步骤S3:基于Convolution和Transformer特征融合的回归网络将N个关键点的N个热力图联合在同一个通道,生成一个单通道具有边界信息的热力图,输出N+1个通道、分辨率为64*64的热力图,N为关键点个数,其中每一个通道为关键点的高斯分布图,取其概率最大值则为所求的关键点;
步骤S4:将输出的热力图通过解码函数,取前N个热力图进行解码,得到精确的N个关键点的坐标信息。
2.根据权利要求1所述的一种基于特征融合的人像关键点检测方法,其特征在于,步骤S2中,通过所述回归网络获得低级语义特征与高级语义特征融合的特征图,其方法为:将Convolution和Transformer并行结构得到不同尺度和不同特征空间的特征图,经过下采样操作后,以跳跃连接,即通道连接方式进行特征融合,从而构造基于Convolution和Transformer特征融合的回归网络;基于Convolution和Transformer特征融合的回归网络的主干模块由CNN卷积神经网络ConvNeXt中的卷积模块blocks构造,辅以Transformer捕捉远距离语义相关信息进一步融合特征。
3.根据权利要求1所述的一种基于特征融合的人像关键点检测方法,其特征在于,Transformer通过一个Embedding操作,将序列输入转化为Token,格式为(N,C,H*W),其中N为一次训练时输入网络的图片数量,C为图片通道数,H和W分别为图片的高度和宽度;Embedding层利用不同卷积核大小的二维卷积应用于(N,C,H,W)的特征图,再将不同分辨率大小的特征图进行双线性插值变为同一个分辨率大小,利用通道连接的方式得到包含不同分辨率的特征图,将此特征图进行格式变化,从(N,C,H,W)方式转化为(N,C,H*W)再送入Transformer的自我注意机制中。
4.根据权利要求3所述的一种基于特征融合的人像关键点检测方法,其特征在于,Transformer中的Embedding操作为:送入的特征图并行通过卷积核大小分别为1*1,3*3,7*7,9*9,步长分别为1,1,2,2的二维卷积,得到四种分辨率大小不同的特征图;再将四种分辨率大小不同的特征图通过双线性插值的方法变成四种分辨率大小相同的特征图进行通道连接,最后通过格式变化函数,将特征图的尺寸变为适合Transformer中自我注意层的大小。
5.根据权利要求3所述的一种基于特征融合的人像关键点检测方法,其特征在于,将Transformer结构中的Self-attention的线性层操作改为位置卷积CoordConv操作,进一步加强自我注意层捕捉远距离高级语义的特征以及通过卷积的形式加入位置信息。
6.一种基于特征融合的人像关键点检测系统,其特征在于,包括存储器、处理器以及存储于存储器上并能够被处理器运行的计算机程序指令,当处理器运行该计算机程序指令时,能够实现如权利要求1-5任一项所述的方法步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210648008.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种地理教学地图展示装置
- 下一篇:公共建筑物可调外窗遮阳结构的施工方法





