[发明专利]视频处理装置、视频处理方法和机器可读存储介质在审
申请号: | 202010230229.X | 申请日: | 2020-03-27 |
公开(公告)号: | CN113453067A | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 杨静;李斐;汪君楚;刘汝杰 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | H04N21/44 | 分类号: | H04N21/44;H04N21/472;G06K9/00;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 唐京桥;姜婷 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 处理 装置 方法 机器 可读 存储 介质 | ||
本公开涉及一种视频处理装置、视频处理方法和机器可读存储介质。视频处理装置包括:获取单元,其基于动作视频剪辑得到初始标记帧;设置单元,其基于关于所述动作视频剪辑的信息来设置滑动窗;匹配单元,其将所述初始标记帧与所述动作视频剪辑在所述滑动窗中的每个帧进行相似度匹配;以及选择单元,其基于相似度匹配的结果,选择所述动作视频剪辑在所述滑动窗中的一个帧作为标记帧。该视频处理装置可以在周期动作片段中正确地捕捉某一次动作实例。
技术领域
本公开涉及视频处理的技术领域,具体地涉及用于动作次数计数的视频处理装置、视频处理方法和机器可读存储介质。
背景技术
这个部分提供了与本公开有关的背景信息,这不一定是现有技术。
周期性或准周期性的动作广泛存在于视频理解任务中。最近,在视频监控、虚拟现实等领域,对这类动作进行检测和周期性统计的需求逐渐增多。在现有技术中,基于深度学习的方法,能够在时序上比较精确地定位不同动作的开始和结束,而当需要在重复多次的同一动作的视频片断中对其中一次动作实例的开始结束进行定位时,问题往往就会变得更具有挑战性。如何在周期动作片段中正确地捕捉某一次动作实例成为了该领域研究中的重要课题。
发明内容
这个部分提供了本公开的一般概要,而不是其全部范围或其全部特征的全面披露。
本公开的目的在于提供一种用于在周期动作片段中正确地捕捉某一次动作实例的视频处理装置、视频处理方法和机器可读存储介质。
根据本公开的一方面,提供了一种视频处理装置,该装置包括:获取单元,其基于动作视频剪辑得到初始标记帧;设置单元,其基于关于所述动作视频剪辑的信息来设置滑动窗;匹配单元,其将所述初始标记帧与所述动作视频剪辑在所述滑动窗中的每个帧进行相似度匹配;以及选择单元,其基于相似度匹配的结果,选择所述动作视频剪辑在所述滑动窗中的一个帧作为标记帧。
根据本公开的另一方面,提供了一种视频处理方法,包括:基于动作视频剪辑得到初始标记帧;基于关于所述动作视频剪辑的信息来设置滑动窗;将所述初始标记帧与所述动作视频剪辑在所述滑动窗中的每个帧进行相似度匹配;以及基于相似度匹配的结果,选择所述动作视频剪辑在所述滑动窗中的一个帧作为标记帧。
根据本公开的另一方面,提供了一种机器可读存储介质,其上携带有包括存储在其中的机器可读指令代码的程序产品,其中,所述指令代码当由计算机读取和执行时,能够使所述计算机执行根据本公开的视频处理方法。
使用根据本公开的视频处理装置、视频处理方法和机器可读存储介质,可以通过在动作视频剪辑中搜索符合条件的标记帧来在动作视频剪辑中正确地捕捉某一次动作实例。
从在此提供的描述中,进一步的适用性区域将会变得明显。这个概要中的描述和特定例子只是为了示意的目的,而不旨在限制本公开的范围。
附图说明
在此描述的附图只是为了所选实施例的示意的目的而非全部可能的实施,并且不旨在限制本公开的范围。在附图中:
图1为图示根据本公开的实施例的视频处理装置的结构的框图;
图2为图示根据本公开的另一实施例的视频处理装置的结构的框图;
图3为图示根据本公开的实施例的视频处理装置中的获取单元的结构的框图;
图4为图示根据本公开的另一实施例的视频处理装置的结构的框图;
图5为图示根据本公开的另一实施例的视频处理装置的部分详细结构的框图;
图6为图示根据本公开的实施例的视频处理方法的流程图;
图7为图示根据本公开的另一实施例的视频处理方法的流程图;以及
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010230229.X/2.html,转载请声明来源钻瓜专利网。