[发明专利]视频分类方法及相关装置在审
| 申请号: | 202111438578.1 | 申请日: | 2021-11-29 |
| 公开(公告)号: | CN114090826A | 公开(公告)日: | 2022-02-25 |
| 发明(设计)人: | 赵娅琳 | 申请(专利权)人: | 北京欧珀通信有限公司 |
| 主分类号: | G06F16/75 | 分类号: | G06F16/75;G06F16/783;G06F16/78 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强 |
| 地址: | 100125 北京市朝阳区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 视频 分类 方法 相关 装置 | ||
1.一种视频分类方法,其特征在于,包括:
获取目标视频和所述目标视频的标题;
确定所述目标视频的图像特征;
确定所述标题的文本特征;
根据所述图像特征、所述文本特征和预先训练好的视频分类模型,得到所述目标视频的目标分类结果。
2.根据权利要求1所述的方法,其特征在于,所述确定所述目标视频的图像特征,包括:
对所述目标视频进行采样得到采样图像;
将所述采样图像输入预先训练好的图像特征提取模型,得到所述图像特征。
3.根据权利要求1所述的方法,其特征在于,所述确定所述标题的文本特征包括:
根据预设的词嵌入编码规则对所述标题对应的文本进行处理,得到所述文本对应的字向量;将所述字向量、预设的文本向量和预设的位置向量输入预先训练好的文本特征提取模型中,得到所述目标视频的文本特征,所述文本向量用于表征标题对应的文本的全局语义特征,位置向量用于对所述标题对应文本中不同位置的字进行区分。
4.根据权利要求1所述的方法,其特征在于,所述根据所述图像特征、所述文本特征和预先训练好的视频分类模型,得到所述目标视频的目标分类结果,包括:
对所述图像特征和所述文本特征进行拼接处理,得到拼接特征;
将所述拼接特征输入所述视频分类模型,得到所述目标视频的目标分类结果。
5.根据权利要求1-3任一项所述的方法,其特征在于,所述图像特征包括N个图像特征,N为不小于3的整数;
根据所述图像特征、所述文本特征和预先训练好的视频分类模型,得到所述目标视频的目标分类结果,包括:
根据所述N个图像特征、所述文本特征和所述视频分类模型,得到所述目标视频的N个参考分类结果,所述N个参考分类结果和所述N个图像特征一一对应;
根据所述N个参考分类结果确定所述目标视频的目标分类结果。
6.根据权利要求5所述的方法,其特征在于,所述根据所述N个参考分类结果确定所述目标视频的目标分类结果,包括:
将所述N个参考分类结果中出现次数最多的参考分类结果确定为所述目标分类结果。
7.根据权利要求1-6任一项所述的方法,其特征在于,每个所述图像特征是根据M帧采样图像得到的,所述M帧采样图像是对所述目标视频进行时序采样得到的,所述M帧采样图像是经过相同数据增强处理的图像,M为大于1的整数。
8.一种视频分类装置,其特征在于,包括:
第一获取单元,用于获取目标视频和所述目标视频的标题;
第一确定单元,用于根据所述目标图像数据得到目标图像特征数据;
第二确定单元,用于根据所述目标文本数据得到目标文本特征数据;
处理单元,用于根据所述图像特征、所述文本特征和预先训练好的视频分类模型,得到所述目标视频的目标分类结果。
9.一种电子设备,其特征在于,包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-7任一项所述的方法中的步骤的指令。
10.一种计算机可读存储介质,其特征在于,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1-7任一项所述的方法中的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京欧珀通信有限公司,未经北京欧珀通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111438578.1/1.html,转载请声明来源钻瓜专利网。





