[发明专利]视频信息处理模型的训练方法、视频信息处理方法及装置在审
申请号: | 202010066286.9 | 申请日: | 2020-01-20 |
公开(公告)号: | CN111324769A | 公开(公告)日: | 2020-06-23 |
发明(设计)人: | 彭广举;徐聪 | 申请(专利权)人: | 腾讯科技(北京)有限公司 |
主分类号: | G06F16/735 | 分类号: | G06F16/735;G06F16/78;G06K9/62;G06N3/04 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 赵翠萍;张颖玲 |
地址: | 100080 北京市海淀区海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 信息处理 模型 训练 方法 装置 | ||
1.一种视频信息处理模型的训练方法,其特征在于,所述方法包括:
获取第一目标视频,确定与所述第一目标视频相对应的第一视频集合和第二视频集合;
对所述第一视频集合中的每一个视频信息进行相关性标注,并对所述第二视频集合中的每一个视频对应的用户行为特征进行标注;
基于对所述第一视频集合的相关性标注,对所述第一目标视频进行解析以实现获取所述第一目标视频的视频参数;
基于所述第一目标视频的视频参数,对视频信息处理模型中的网络参数进行调整,以实现所述视频信息处理模型与所述第一视频集合的相关性相匹配;
基于所述第二视频集合的用户行为特征标注,对视频信息处理模型中的网络参数进行调整,以实现所述视频信息处理模型与所述第二视频集合的用户行为特征相匹配并且与所述第一视频集合的相关性相匹配。
2.根据权利要求1所述的方法,其特征在于,所述对所述第一视频集合中的每一个视频信息进行相关性标注,并对所述第二视频集合中的每一个视频对应的用户行为特征进行标注,包括:
确定与所述第一目标视频对应的不同维度的相关性参数;
根据所述不同维度的相关性参数对所述第一视频集合中的每一个视频的相关性进行标注,以获取与所述第一视频集合相匹配的训练样本集合;
确定与所述第二视频集合对应的播放日志信息;
根据所述播放日志信息所包括的不同维度的播放行为参数,对所述第二视频集合中的每一个视频对应的用户行为特征进行标注,以获取与所述第二视频集合相匹配的训练样本集合。
3.根据权利要求1所述的方法,其特征在于,所述对所述第一目标视频进行解析以实现获取所述第一目标视频的视频参数,包括:
对所述第一目标视频进行解析,获取所述第一目标视频的标签信息;
根据所述第一目标视频的标签信息,对所述第一目标视频所对应的视频信息进行解析,以实现分别获取与所述第一目标视频在基础维度与多模态维度中的视频参数。
4.根据权利要求1所述的方法,其特征在于,所述基于所述第一目标视频的视频参数,对视频信息处理模型中的网络参数进行调整,以实现所述视频信息处理模型与所述第一视频集合的相关性相匹配,包括:
根据所述第一目标视频的视频参数,确定与所述第一目标视频相匹配的基础特征,以及与所述第一目标视频相匹配的多模态特征;
基于与所述第一目标视频相匹配的基础特征和多模态特征,对视频信息处理模型中的网络参数进行调整,以实现所述视频信息处理模型与所述第一视频集合的相关性相匹配。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第一目标视频的视频参数,确定与所述第一目标视频相匹配的基础特征,以及与所述第一目标视频相匹配的多模态特征,包括:
根据所述第一目标视频在基础维度中的视频参数,确定与所述第一目标视频相对应的类别参数、视频标签参数和视频发布来源参数;
对所述第一目标视频相对应的类别参数、视频标签参数和视频发布来源参数分别进行特征抽取,以形成与所述第一目标视频相匹配的基础特征;
根据所述第一目标视频在基础维度中的视频参数,确定与所述第一目标视频相对应的标题文字参数、图像信息参数和视觉信息参数;
对所述第一目标视频相对应的标题文字参数、图像信息参数和视觉信息参数分别进行特征抽取并融合,以形成与所述第一目标视频相匹配的多模态特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(北京)有限公司,未经腾讯科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010066286.9/1.html,转载请声明来源钻瓜专利网。