[发明专利]为视频自动打标签的方法及装置、介质和电子设备在审
申请号: | 201811542198.0 | 申请日: | 2018-12-17 |
公开(公告)号: | CN109635158A | 公开(公告)日: | 2019-04-16 |
发明(设计)人: | 陈方毅;陈晓君;李君懿;陶建 | 申请(专利权)人: | 杭州柚子街信息科技有限公司 |
主分类号: | G06F16/78 | 分类号: | G06F16/78 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
地址: | 310000 浙江省杭州市余杭区仓前街道文一*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签 视频 视频帧序列 机器学习模型 电子设备 视频处理技术 输出视频帧 视频分解 输入机器 预定规则 准确率 成帧 串联 分解 分组 响应 学习 | ||
本公开是关于一种为视频自动打标签的方法及装置、介质和电子设备,属于视频处理技术领域。该方法包括:响应于获取到视频,将所述视频分解成帧;将分解成的帧按照预定规则分组;将每一组的帧串联成视频帧序列;将所述视频帧序列输入机器学习模型,由所述机器学习模型输出视频帧序列的标签;基于视频帧序列的标签,为所述视频打标签。本公开通过机器学习模型自动为视频打标签,提高了打标签的准确率和效率。
技术领域
本公开涉及视频处理技术领域,具体而言,涉及一种为视频自动打标签的方法及装置、介质和电子设备。
背景技术
视频标签是按照视频属性进行分类而设定的标签,是对视频内容进行排序以及向用户提供个性化推荐等的重要依据。
近年来,通过视频进行传播信息、表现自我等具有很高的热度。用户寻找自己感兴趣的视频及某些商家或者平台推荐视频都需要依据视频的标签。尤其,通常视频中有很大部分是没有语音和字幕信息的。按照常规通过视频语音和字幕来给视频打标签的方法并不可行。而依赖人工标定的方式会造成对这部分视频打标签的低效率、低准确度问题。
因此,需要提供一种新的为视频自动打标签的方法和装置、介质和电子设备。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种为视频自动打标签的方案,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的为视频打标签的低效率、低准确率问题。
根据本公开的一个方面,提供一种为视频自动打标签的方法,包括:
响应于获取到视频,将所述视频分解成帧;
将分解成的帧按照预定规则分组;
将每一组的帧串联成视频帧序列;
将所述视频帧序列输入机器学习模型,由所述机器学习模型输出视频帧序列的标签;
基于视频帧序列的标签,为所述视频打标签,
其中,所述机器学习模型按照如下方式训练:将视频帧序列样本集合中的各视频帧序列样本输入所述机器学习模型,所述视频帧序列样本是将各种已知标签的视频按照所述预定规则分组,并将每一组的帧串联而成的,所述机器学习模型输出视频帧序列样本所来自的视频的标签,与视频已知标签进行比较,如果不一致,则调整所述机器学习模型中的系数,使所述机器学习模型输出的标签与该视频已知标签一致。
在本公开的一种示例性实施例中,将分解成的帧按照预定规则分组包括:
将连续预定数目个帧作为一组。
在本公开的一种示例性实施例中,将分解成的帧按照预定规则分组包括:
从分解的帧中随机取预定数目个帧作为一组。
在本公开的一种示例性实施例中,将分解成的帧按照预定规则分组包括:
将所述视频分解成的帧等分为N组,N为正整数,视频帧序列的数目也是N,将帧号为aN+i的帧组成第i个组,其中,a和i为正整数,0≦a≦N-1,1≦i≦N。
在本公开的一种示例性实施例中,所述将每一组的帧串联成视频帧序列包括:
按照每一帧的帧号的先后顺序将每一组的帧串联成视频帧序列。
在本公开的一种示例性实施例中,所述基于视频帧序列的标签,为所述视频打标签,包括:
将得到的视频帧序列的标签中概率权重占比最大的标签作为视频最终标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州柚子街信息科技有限公司,未经杭州柚子街信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811542198.0/2.html,转载请声明来源钻瓜专利网。