[发明专利]一种多视图身份识别方法在审
申请号: | 202110863815.2 | 申请日: | 2021-07-29 |
公开(公告)号: | CN113591692A | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 张南海 | 申请(专利权)人: | 赢识科技(杭州)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62 |
代理公司: | 杭州云睿专利代理事务所(普通合伙) 33254 | 代理人: | 张骁敏 |
地址: | 311121 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视图 身份 识别 方法 | ||
1.一种多视图身份识别方法,其特征在于,包括以下步骤:
对输入图片采用一体化的检测网络进行人脸、人体、上半身检测,检测网络基于anchor-free的检测框架,共享同一热力图,同时回归人脸坐标、人体坐标、上半身坐标;
依据坐标信息,对人脸、人体、上半身分别进行预处理,先检测人脸的关键点,并根据关键点进行人脸对齐,再将人体和上半身通过缩放至统一大小实现上半身对齐和人体对齐,形成新的输入图片;
将新的输入图片切成固定大小的小块并进行序列化,生成人脸视图、上半身视图和人体视图,采用多模态融合特征提取网络完成特征提取,多模态融合特征提取网络的输出作为特征,最后进行特征比对完成身份识别。
2.根据权利要求1所述的一种多视图身份识别方法,其特征在于,所述检测网络主干网络采用深度全卷积神经网络,训练过程的热力图采用二分类损失函数监督,热力图表示目标的中心。
3.根据权利要求2所述的一种多视图身份识别方法,其特征在于,所述检测网络还包括三个分支,分别学习人脸坐标、人体坐标和上半身坐标,训练过程人脸、人体、上半身的坐标采用L1损失函数监督。
4.根据权利要求1所述的一种多视图身份识别方法,其特征在于,所述人脸关键点的检测通过检测两眼中心、鼻尖、两嘴角五个关键点,利用这五个关键点做仿射变换以对齐人脸。
5.根据权利要求1所述的一种多视图身份识别方法,其特征在于,所述多模态融合特征提取网络基于transformer实现,人脸视图、上半身视图和人体视图的每一种视图都连接一个ViT网络,上半身视图与人脸视图、人体视图均共同连接有一个跨模态的ViT网络,ViT网络和跨模态的ViT网络输出的特征输入至tranformer进行特征融合,最后只需要计算tranformer的输出作为特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于赢识科技(杭州)有限公司,未经赢识科技(杭州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110863815.2/1.html,转载请声明来源钻瓜专利网。