[发明专利]为视频自动打标签的方法及装置、介质和电子设备在审
申请号: | 201811542198.0 | 申请日: | 2018-12-17 |
公开(公告)号: | CN109635158A | 公开(公告)日: | 2019-04-16 |
发明(设计)人: | 陈方毅;陈晓君;李君懿;陶建 | 申请(专利权)人: | 杭州柚子街信息科技有限公司 |
主分类号: | G06F16/78 | 分类号: | G06F16/78 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
地址: | 310000 浙江省杭州市余杭区仓前街道文一*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签 视频 视频帧序列 机器学习模型 电子设备 视频处理技术 输出视频帧 视频分解 输入机器 预定规则 准确率 成帧 串联 分解 分组 响应 学习 | ||
1.一种为视频自动打标签的方法,其特征在于,包括:
响应于获取到视频,将所述视频分解成帧;
将分解成的帧按照预定规则分组;
将每一组的帧串联成视频帧序列;
将所述视频帧序列输入机器学习模型,由所述机器学习模型输出视频帧序列的标签;
基于视频帧序列的标签,为所述视频打标签,
其中,所述机器学习模型按照如下方式训练:将视频帧序列样本集合中的各视频帧序列样本输入所述机器学习模型,所述视频帧序列样本是将各种已知标签的视频按照所述预定规则分组,并将每一组的帧串联而成的,所述机器学习模型输出视频帧序列样本所来自的视频的标签,与视频已知标签进行比较,如果不一致,则调整所述机器学习模型中的系数,使所述机器学习模型输出的标签与该视频已知标签一致。
2.根据权利要求1所述的方法,其特征在于,所述预定规则包括:将连续预定数目个帧作为一组。
3.根据权利要求1所述的方法,其特征在于,所述预定规则包括:将所述视频分解成的帧等分为N组,N为正整数,叠加帧的数目也是N,将帧号为aN+i的帧组成第i个组,其中,a和i为正整数,0≦a≦N-1,1≦i≦N。
4.根据权利要求1所述的方法,其特征在于,所述将每一组的帧串联成视频帧序列包括:
按照每一帧的帧号的先后顺序将每一组的帧串联成视频帧序列。
5.根据权利要求1所述的方法,其特征在于,所述基于视频帧序列的标签,为所述视频打标签,包括:
将得到的视频帧序列的标签中数目最大的标签作为为视频打的标签。
6.根据权利要求5所述的方法,其特征在于,将得到的视频帧序列的标签中数目最大的标签作为为视频打的标签,包括:
如果所述数目最大的标签有多个,增加分解成的帧分组的数目。
7.根据权利要求6所述的方法,其特征在于,所述增加分解成的帧分组的数目包括:如果预定规则包括将连续预定数目个帧作为一组,则增加组的数目,使至少一部分组包含的帧部分重叠。
8.一种为视频自动打标签的装置,其特征在于,包括:
分解模块,用于响应于获取到视频,将所述视频分解成帧;
分组模块,用于将分解成的帧按照预定规则分组;
叠加模块,用于将每一组的帧串联成视频帧序列;
第一标定模块,用于将所述视频帧序列输入机器学习模型,由所述机器学习模型输出视频帧序列的标签;
第二标定模块,用于基于视频帧序列的标签,为所述视频打标签,
其中,所述机器学习模型按照如下方式训练:将视频帧序列样本集合中的各视频帧序列样本输入所述机器学习模型,所述视频帧序列样本是将各种已知标签的视频按照所述预定规则分组,并将每一组的帧串联而成的,所述机器学习模型输出视频帧序列样本所来自的视频的标签,与视频已知标签进行比较,如果不一致,则调整所述机器学习模型中的系数,使所述机器学习模型输出的标签与该视频已知标签一致。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任一项所述的方法。
10.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-7任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州柚子街信息科技有限公司,未经杭州柚子街信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811542198.0/1.html,转载请声明来源钻瓜专利网。