[发明专利]一种视频处理方法及装置在审
| 申请号: | 201910559324.1 | 申请日: | 2019-06-26 |
| 公开(公告)号: | CN110414348A | 公开(公告)日: | 2019-11-05 |
| 发明(设计)人: | 王强 | 申请(专利权)人: | 深圳云天励飞技术有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
| 地址: | 518000 广东省深圳市龙岗区园山*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 步态周期 矢量特征 多帧图像 视频 视频处理 匹配度 存储 图像 人体关节 普适性 阈值时 网络 | ||
本发明实施例提供一种视频处理方法及装置,该方法包括:获取待识别行人视频,待识别行人视频包括多帧图像;将多帧图像输入OpenPose网络,得到多张待识别矢量特征图,多张待识别矢量特征图为人体关节点的矢量特征图;将多张待识别矢量特征图输入LSTM网络,得到第一步态周期特征;计算第一步态周期特征与第二步态周期特征的匹配度,第二步态周期特征为根据存储的行人视频包括的图像得到的步态周期特征;当匹配度大于阈值时,确定多帧图像中的行人与存储的行人视频包括的图像中的行人为同一行人。实施本发明实施例,可以提高普适性和准确性。
技术领域
本发明涉及图像识别技术领域,具体涉及一种视频处理方法及装置。
背景技术
步态识别是通过获取一段待检测行人正常行走的视频与已经存储好的行人行走视频作对比,找出待检测行人对应于数据库中人物的身份,具有检测过程无感和非接触等优点,能解决人脸识别在大角度和有遮挡等情况下身份识别受限等问题。目前,步态识别可以基于特征建模联合机器学习识别,即从轮廓图序列中手工提取与步态相关的静态或动态特征,然后使用机器学习的方法对特征进行降维或匹配。上述方法对手工提取的特征准确度要求很高,诸如步态能量图类的动态特征要求行人必须处于视频中间,提取要求苛刻,以致降低了普适性和准确性。
发明内容
本发明实施例提供一种视频处理方法及装置,可以提高普适性和准确性。
第一方面提供一种视频处理方法,包括:
获取待识别行人视频,所述待识别行人视频包括多帧图像;
将所述多帧图像输入OpenPose网络,得到多张待识别矢量特征图,所述多张待识别矢量特征图为人体关节点的矢量特征图;
将所述多张待识别矢量特征图输入长短期记忆LSTM网络,得到第一步态周期特征;
计算所述第一步态周期特征与第二步态周期特征的匹配度,所述第二步态周期特征为根据存储的行人视频包括的图像得到的步态周期特征;
当所述匹配度大于阈值时,确定所述多帧图像中的行人与所述存储的行人视频包括的图像中的行人为同一行人。
由于不需要手工提取与步态相关的静态或动态特征,因此,可以提高普适性以及视频处理效率。此外,由于LSTM网络是一种能处理时序信息的网络,因此,可以较好地处理视频中不同帧之间的信息,从而可以提高步态识别准确性。
作为一种可能的实施方式,所述方法还包括:
获取训练行人视频;
将所述训练行人视频包括的图像输入所述OpenPose网络,得到多张训练矢量特征图,所述多张训练矢量特征图为人体关节点的矢量特征图;
将所述多张训练矢量特征图中的M张连续训练矢量特征图输入初始LSTM网络,得到所述训练行人视频包括的图像中的行人属于训练行人中每个行人的概率,所述M为大于1的整数;
根据所述概率计算第一损失;
根据所述第一损失优化所述初始LSTM网络的参数,得到所述LSTM网络。
可见,在训练LSTM网络时考虑了视频中不同帧之间的时序信息,因此,可以提高LSTM网络步态识别准确性。
作为一种可能的实施方式,所述将所述多张待识别矢量特征图输入LSTM网络,得到第一步态周期特征包括:
将所述多张待识别矢量特征图中的M张连续待识别矢量特征图输入LSTM网络,得到第一步态周期特征;
所述确定所述多帧图像中的行人与所述存储的行人视频包括的图像中的行人为同一行人包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳云天励飞技术有限公司,未经深圳云天励飞技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910559324.1/2.html,转载请声明来源钻瓜专利网。





