[发明专利]预测人脸图像的关键点坐标的方法和装置在审
申请号: | 202111358107.X | 申请日: | 2021-11-16 |
公开(公告)号: | CN114299563A | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 李晖;郭子栋;韩在濬;李宣旼;韩承周 | 申请(专利权)人: | 三星(中国)半导体有限公司;三星电子株式会社 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06F17/16;G06K9/62;G06N3/04;G06N3/08;G06V10/774;G06V10/82 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 曾世骁;于翔 |
地址: | 710000 陕西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预测 图像 关键 标的 方法 装置 | ||
1.一种预测人脸图像的关键点坐标的方法,包括:
通过卷积神经网络层获取人脸图像的多级特征图;
通过全连接层将所述多级特征图中的最后一级特征图进行全连接以获取初始查询矩阵,其中,初始查询矩阵表示人脸图像的关键点的初始特征,其中,初始查询矩阵中元素的数量等于人脸图像的关键点的数量;
通过对多级特征图进行展平和连接操作获取记忆特征矩阵;
将记忆特征矩阵和初始查询矩阵输入级联的至少一个解码器层以确定人脸图像的关键点坐标。
2.如权利要求1所述的方法,
其中,每个解码器层包括级联的自注意力模块层、可变形注意力模块层和关键点坐标预测层,
其中,所述确定人脸图像的关键点坐标的步骤包括:
将嵌入了位置信息的初始查询矩阵、嵌入了位置信息的初始查询矩阵和初始查询矩阵作为第一个解码器层的自注意力模块层的查询矩阵、键矩阵和值矩阵输入到第一解码器层的自注意力模块层;
将当前解码器层的自注意力模块层的输出矩阵、记忆特征矩阵和上一解码器层预测的关键点坐标输入到当前解码器层的可变形注意力模块层以获得可变形注意力模块层的输出矩阵,其中,自注意力模块层的输出矩阵和记忆特征矩阵为可变形注意力模块层的查询矩阵和值矩阵,其中,输入到第一解码器层的可变形注意力模块层的上一解码器层预测的关键点坐标为基于初始查询矩阵获得的初始关键点坐标;
将当前解码器层的可变形注意力模块层的输出矩阵、嵌入了位置信息的可变形注意力模块层的输出矩阵和嵌入了位置信息的可变形注意力模块层的输出矩阵作为级联的下一解码器层的自注意力模块层的值矩阵、查询矩阵和键矩阵输入到下一解码器层的自注意力模块层;
将当前解码器层的可变形注意力模块层的输出矩阵输入到当前解码器层的关键点坐标预测层以获得当前解码器层预测的人脸图像的关键点坐标,其中最后一个解码器层预测的人脸图像的关键点坐标作为最终的人脸图像的关键点坐标。
3.如权利要求2所述的方法,其中,每个解码器层的自注意力模块层的输出矩阵通过以下公式获得:
其中,表示输出矩阵中的第i个行向量,αij表示对输入到自注意力模块层的查询矩阵的第i个行向量与输入到自注意力模块层的键矩阵的第j个行向量的点积执行归一化获得的注意力权重,qj表示初始查询矩阵或上一解码器层的变形注意力层的输出矩阵中的第j个行向量,N表示人脸图像的关键点的数量。
4.如权利要求3所述的方法,其中,每个解码器层的可变形注意力模块层的输出矩阵通过以下公式获得:
其中,fi表示第i个关键点的更新的特征,βik表示对输入到可变形注意力模块层的查询矩阵执行全连接操作和softmax操作而获得的注意力权重,xik表示记忆特征矩阵中的与第k个参考点坐标相应的特征,其中,第k个参考点坐标与上一解码器层预测的关键点坐标中的第i个关键点坐标之间的位置偏移是通过对输入到可变形注意力模块层的查询矩阵执行全连接操作得到的,其中,K为预设值。
5.如权利要求2所述的方法,其中,每个解码器层预测的关键点坐标通过以下公式获得:
y=σ(yO+σ-1(yR))
其中,y表示当前解码器层预测的关键点坐标,yR表示上一解码器层预测的关键点坐标或初始关键点坐标,yO表示关键点坐标预测层的输出,指示y相对于yR的偏移。
6.如权利要求2所述的方法,其中卷积网络层、全连接层以及至少一个解码器层通过基于以下回归损失函数利用训练图像样本进行训练而获得:
其中,Lreg表示回归损失,yl表示每个解码器层预测的训练图像样本的关键点坐标,表示训练图像样本的实际的关键点坐标,Ld为解码器层的数量,l为解码器层的索引。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星(中国)半导体有限公司;三星电子株式会社,未经三星(中国)半导体有限公司;三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111358107.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:工程机械装备的智能控制方法、装置及工程机械装备
- 下一篇:可折叠儿童座椅
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序