[发明专利]视频图像的识别方法、系统以及计算机可读存储介质有效
申请号: | 202111184272.8 | 申请日: | 2021-10-12 |
公开(公告)号: | CN113642531B | 公开(公告)日: | 2022-02-22 |
发明(设计)人: | 王雨桐;黄明杨;马菲莹;谢宣松 | 申请(专利权)人: | 阿里巴巴达摩院(杭州)科技有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/80;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京博浩百睿知识产权代理有限责任公司 11134 | 代理人: | 谢湘宁 |
地址: | 310023 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 图像 识别 方法 系统 以及 计算机 可读 存储 介质 | ||
本申请公开了一种视频图像的识别方法、系统以及计算机可读存储介质。其中,该方法包括:从当前帧图像中识别出待识别对象,其中,当前帧图像为待识别的视频图像所包含的图像,并对待识别对象进行特征融合,得到当前帧图像中待识别对象的至少一个候选关键点,从而基于上一帧图像中待识别对象的至少一个关键点对至少一个候选关键点进行融合处理,得到当前帧图像中待识别对象的至少一个目标关键点,进而根据至少一个目标关键点对待识别对象的姿态进行识别,得到识别结果。本申请解决了现有技术中,识别视频图像中的目标对象的关键点时存在识别不准确的技术问题。
技术领域
本申请涉及人工智能领域,具体而言,涉及一种视频图像的识别方法、系统以及计算机可读存储介质。
背景技术
随着生活水平的提高,人们越来越重视身体健康,其中,家庭健身成为人们追求健康生活方式的一大趋势,受限于场地以及时间等原因,线上健身方式也受到了广大群众的欢迎。在全民健身的浪潮中,关于健身的人工智能健身技术应用而生,方便了人们对自身健康状况的测评。
但是,由于人体自身的柔韧性和肢体的高自由度,任何关节的微小变化都会产生新的姿态,使得人体数据的收集、关键点检测以及动作识别成为很有挑战的问题。除了姿态多样性,人工健身检测还会受人体自身的穿着、视角、光照以及遮挡等因素的影响,进一步加大了精准识别人体关键点的难度。
另外,现有技术在进行人体关键点识别时,通常采用自底向上的检测算法,虽然能够支持多人关键点检测,但会容易受到图像中其他背景对象的影响,出现错检、多检测的情形,并且现有的自底向上的检测算法中并不包括人体跟踪逻辑,因此在对视频图像实时检测时,会出现明显抖动、漏检等现象。
而且,现有技术对于地面卧姿的识别精度较差,而健身运动中会有很多卧姿动作,从而也会经常出现容易出现错检的情形。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种视频图像的识别方法、系统以及计算机可读存储介质,以至少解决现有技术中,识别视频图像中的目标对象的关键点时存在识别不准确的技术问题。
根据本申请实施例的一个方面,提供了一种视频图像的识别方法,包括:从当前帧图像中识别出待识别对象,其中,当前帧图像为待识别的视频图像所包含的图像,并对待识别对象进行特征融合,得到当前帧图像中待识别对象的至少一个候选关键点,从而基于上一帧图像中待识别对象的至少一个关键点对至少一个候选关键点进行融合处理,得到当前帧图像中待识别对象的至少一个目标关键点,进而根据至少一个目标关键点对待识别对象的姿态进行识别,得到识别结果。
在一种可选的实施例中,视频图像的识别方法还包括:获取当前帧图像对应的帧标识,并根据帧标识确定当前帧图像对应的帧类型。
在一种可选的实施例中,视频图像的识别方法还包括:在当前帧图像的帧类型为关键帧时,基于第一神经网络模型对当前帧图像进行图像处理,得到待识别对象在当前帧图像的候选区域,并基于候选区域对当前帧图像进行裁剪,从当前帧图像中识别出待识别对象。
在一种可选的实施例中,视频图像的识别方法还包括:获取第二神经网络模型对待识别对象进行特征提取,得到多个对象特征,其中,第二神经网络模型至少包括残差网络,残差网络由多个残差单元组成。从而确定残差网络所对应的目标残差深度,并根据目标残差深度确定目标残差网络,进而获取目标残差网络对多个对象特征进行特征融合的融合结果,根据融合结果确定至少一个候选关键点。
在一种可选的实施例中,视频图像的识别方法还包括:在当前帧图像的帧类型为非关键帧时,获取待识别对象在上一帧图像中的预设区域,并对预设区域进行扩展处理,得到扩展后的预设区域,从而基于扩展后的预设区域确定待识别对象在当前帧图像中的候选区域,并基于候选区域对当前帧图像进行裁剪,从当前帧图像中识别出待识别对象。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴达摩院(杭州)科技有限公司,未经阿里巴巴达摩院(杭州)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111184272.8/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序