[发明专利]关键点检测模型训练方法、关键点检测方法及装置在审
申请号: | 202110263320.6 | 申请日: | 2021-03-11 |
公开(公告)号: | CN112990298A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 刘京;张慧;王雅丽 | 申请(专利权)人: | 北京中科虹霸科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/08;G06N3/04 |
代理公司: | 北京金咨知识产权代理有限公司 11612 | 代理人: | 秦景芳 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键 检测 模型 训练 方法 装置 | ||
1.一种关键点检测模型训练方法,其特征在于,包括:
获取训练样本集;其中,所述训练样本集中包括第一类型的训练样本和第二类型的训练样本,所述第一类型的训练样本包括训练图像、训练图像中的关键点的位置及相应关键点的可用性,所述第二类型的训练样本包括训练图像;
利用第一类型的训练样本和第一总损失函数训练教师网络,得到训练后的教师网络;其中,所述第一总损失函数包括用于约束关键点的可用性的损失函数和用于约束关键点的位置的损失函数;
从所述训练样本集中选取第一训练样本,在所述第一训练样本为所述第二类型的训练样本的情况下,将所述第一训练样本输入至训练后的教师网络,得到第一关键点位置预测结果和相应的第一关键点可用性预测结果,并将所述第一训练样本输入至学生网络,得到第二关键点位置预测结果和相应的第二关键点可用性预测结果;
将所述第一关键点位置预测结果、所述第一关键点可用性预测结果、所述第二关键点位置预测结果、及第二关键点可用性预测结果输入至第二总损失函数,得到第二总损失函数的第一数值,并将第二总损失函数的第一数值反馈至学生网络,以基于训练后的教师网络的知识蒸馏利用第二类型的训练样本训练学生网络,并根据训练后的学生网络或包括训练后的学生网络和训练后的教师网络的网络得到关键点检测模型;其中,所述第二总损失函数包括用于约束学生网络的关键点位置预测结果接近教师网络的关键点位置预测结果的损失函数和用于约束学生网络的关键点可用性预测结果接近教师网络的关键点可用性预测结果的损失函数。
2.如权利要求1所述的关键点检测模型训练方法,其特征在于,所述第二总损失函数还包括用于约束学生网络的关键点位置预测结果接近已知关键点位置的损失函数和用于约束学生网络的关键点可用性预测结果接近已知关键点可用性预测结果的损失函数;
根据训练后的学生网络或包括训练后的学生网络和训练后的教师网络的网络得到关键点检测模型之前,所述方法,还包括:
从所述训练样本集中选取第二训练样本,在所述第二训练样本为所述第一类型的训练样本的情况下,将所述第二训练样本输入至学生网络,得到第三关键点位置预测结果和相应的第三关键点可用性预测结果,并将所述第三关键点位置预测结果和所述第三关键点可用性预测结果输入至所述第二总损失函数,得到第二总损失函数的第二数值,并将第二总损失函数的第二数值反馈至学生网络,以利用第一类型的训练样本训练学生网络。
3.如权利要求2所述的关键点检测模型训练方法,其特征在于,从所述训练样本集中选取第二训练样本,在所述第二训练样本为所述第一类型的训练样本的情况下,将所述第二训练样本输入至学生网络,得到第三关键点位置预测结果和相应的第三关键点可用性预测结果,并将所述第三关键点位置预测结果和所述第三关键点可用性预测结果输入至所述第二总损失函数,得到第二总损失函数的第二数值,并将第二总损失函数的第二数值反馈至学生网络,以利用第一类型的训练样本训练学生网络,包括:
从所述训练样本集中选取第二训练样本,在所述第二训练样本为所述第一类型的训练样本的情况下,屏蔽掉所述第二总损失函数中的用于约束学生网络的关键点位置预测结果接近教师网络的关键点位置预测结果的损失函数和用于约束学生网络的关键点可用性预测结果接近教师网络的关键点可用性预测结果的损失函数,并将所述第二训练样本输入至学生网络,得到第三关键点位置预测结果和相应的第三关键点可用性预测结果,并将所述第三关键点位置预测结果和所述第三关键点可用性预测结果输入至所述第二总损失函数,得到第二总损失函数的第二数值,并将第二总损失函数的第二数值反馈至学生网络,以利用第一类型的训练样本训练学生网络。
4.如权利要求2所述的关键点检测模型训练方法,其特征在于,
用于约束学生网络的关键点位置预测结果接近教师网络的关键点位置预测结果的损失函数为均方误差损失函数,和/或,用于约束学生网络的关键点位置预测结果接近已知关键点位置的损失函数为均方误差损失函数;
用于约束学生网络的关键点可用性预测结果接近教师网络的关键点可用性预测结果的损失函数为交叉熵损失函数,和/或,用于约束学生网络的关键点可用性预测结果接近已知关键点可用性预测结果的损失函数为交叉熵损失函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科虹霸科技有限公司,未经北京中科虹霸科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110263320.6/1.html,转载请声明来源钻瓜专利网。