[发明专利]一种人脸检测质量评分方法及系统有效
申请号: | 202110688239.2 | 申请日: | 2021-06-21 |
公开(公告)号: | CN113420806B | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 刘芳;任保家;黄欣研;李玲玲;刘洋;刘旭;郭雨薇;郝泽华 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06V10/776 | 分类号: | G06V10/776;G06V40/16;G06V10/74 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 高博 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 检测 质量 评分 方法 系统 | ||
1.一种人脸检测质量评分方法,其特征在于,包括以下步骤:
S1、获取人脸图像及其对应的标注数据,构造形式为人脸-人脸标注的成对数据集;
S2、构造人脸检测网络D,将步骤S1构造的成对数据集分批次输入到人脸检测网络D中进行训练,每批次的大小为B;
S3、构造智能体RLQAgent,智能体RLQAgent的输入是状态s;
S4、构造训练过程中自动调整奖惩力度的奖励函数R(s,a);并与步骤S2的人脸检测网络D组合成环境生成器Env,Env产生状态s,将状态s输入到步骤S3构造的智能体RLQAgent中,得到决策动作a;根据状态s和决策动作a得到奖励值R;
S5、构造经验回放池ReplayBuffer,对步骤S4得到的数据[s,a,R,s′]进行缓存,s′为下一时刻环境Env产生的状态;
S6、构造目标Q网络Qtarget和实时Q网络Qreal,将目标Q网络Qtarget作为参考的智能体RLQAgent,用于输出累计奖励值的期望;将实时Q网络Qreal作为实时训练的智能体RLQAgent,使用步骤S5构造的经验回放池ReplayBuffer对实时Q网络Qreal进行训练,得到实时Q网络Qreal的网络权重Θ,具体为:
S601、重置环境Env,得到初始的状态s0;
S602、随机初始化经验回放池ReplayBuffer,得到[s,a,R,s′]数据,[s,a,R,s′]数据中的s为步骤S601中得到的初始状态s0;
S603、从经验回放池ReplayBuffer中获取64个样本;
S604、使用步骤S603中得到的64个样本训练实时Q网络Qreal并计算损失值,并增加正则项部分对模型进行约束,通过批随机梯度下降的方法更新实时Q网络Qreal中的网络权重Θ,损失值L(Θ)计算如下:
其中,为累计奖励期望值,L(Θ)为损失值;λ为正则项系数,Θ为实时Q网络Qreal的权重;
S605、将实时Q网络Qreal与环境Env交互,并将产生新的[s,a,R,s′]的记录存放到经验回放池ReplayBuffer;
S606、重复步骤S605,直到达到512次;
S607、根据更新频率判断是否需要更新目标Q网络Qtarget,如果需要更新,转到步骤S608,否则,转到步骤S609;
S608、将智能体Qreal的权重Θ拷贝到目标Q网络Qtarget中;
S609、重复步骤S603~步骤S608,直到200次数,并输出实时Q网络Qreal中的权重Θ;
S7、使用步骤S6得到的网络权重Θ初始化智能体RLQAgent,并与步骤S2的人脸检测网络D进行组合,实现在检测到人脸F的同时完成对人脸F的质量评分。
2.根据权利要求1所述的方法,其特征在于,步骤S2中,构造人脸检测网络D具体为:
S201、构造骨干网络Resnet50,产生3种不同尺度的特征T1,T2,T3;
S202、构造包括第一上采样层U1、第二上采样层U2、第三上采样层U3的特征金字塔网络FPN,得到中间特征T1,T2,T3;
S203、构造包括第一3×3卷积层、第一5×5卷积层、第二5×5卷积层、第一7×7卷积层和第二7×7卷积层的上下文信息模块SSH,得到最终特征F1,F2,F3;
S204、构造BoxHead、LandMarkHead、Classification;产生最终的人脸位置、人脸关键点和是否为人脸的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110688239.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种抗拔钢桩及成桩方法
- 下一篇:一种凝结水精处理树脂长距离输送的方法及系统