[发明专利]一种视频的标签化处理方法、装置和计算设备有效
申请号: | 201811400848.8 | 申请日: | 2018-11-22 |
公开(公告)号: | CN109684506B | 公开(公告)日: | 2023-10-20 |
发明(设计)人: | 罗玄;张好;黄君实;陈强 | 申请(专利权)人: | 三六零科技集团有限公司 |
主分类号: | G06F16/73 | 分类号: | G06F16/73;G06F16/78;G06V20/40;G06V10/762;G06V10/774;G06V10/764 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
地址: | 300450 天津市滨海新区华苑产*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 标签 处理 方法 装置 计算 设备 | ||
本发明提供了一种视频的标签化处理方法和装置。该方法包括:获取原始视频数据;将所述原始视频数据输入特征提取网络进行图像特征提取,得到所述原始视频的第一预设维度的图像特征向量;对所述图像特征向量进行聚类分析,得到所述图像特征向量对应的原始视频的不同分类;针对所述图像特征向量对应的原始视频的不同分类,提取同一类中的原始视频对应的标题中的关键字,并根据第一预定规则从所述关键字中选取一个或多个关键字作为该类别的原始视频的标签。本发明实施例的方案实现了高效、准确的视频分类,并实现了高准确度和全面性的视频标签化,从而能够提高视频的搜索命中率和推荐准确率。
技术领域
本发明涉及视频处理技术领域,特别是一种视频的标签化处理方法、视频的标签化处理装置、计算机存储介质以及计算设备。
背景技术
随着网络技术的发展和普及,出现了大量聚合类视频的分发平台,能够为网络用户提供个性化的视频服务,包括上传、搜索、推荐、播放、下载等服务。为了便于用户搜索和使用视频,并贴合用户的兴趣和需求进行视频的推荐,需要对平台上的海量视频进行准确的分类并为每个视频分配全面、合理的标签。现有的视频标签化方法通常通过人工标注,或仅简单地通过单个视频的标题和说明文字提取关键字作为标签,操作效率低、准确度低、标签涵盖面小。因此,亟需一种高效率、高准确度和全面性的视频标签化处理技术。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的视频的标签化处理方法、视频的标签化处理装置、计算机存储介质以及计算设备。
根据本发明实施例的一方面,提供了一种视频的标签化处理方法,包括:
获取原始视频数据;
将所述原始视频数据输入特征提取网络进行图像特征提取,得到所述原始视频的第一预设维度的图像特征向量;
对所述图像特征向量进行聚类分析,得到所述图像特征向量对应的原始视频的不同分类;
针对所述图像特征向量对应的原始视频的不同分类,提取同一类中的原始视频对应的标题中的关键字,并根据第一预定规则从所述关键字中选取一个或多个关键字作为该类别的原始视频的标签。
可选地,将所述原始视频数据输入特征提取网络进行图像特征提取,得到所述原始视频的第一预设维度的图像特征向量,包括:
对所述原始视频数据进行解码,得到多个视频帧;
将所述多个视频帧中的每一视频帧输入卷积神经网络CNN进行图像特征提取,得到每一视频帧的第二预设维度的图像特征向量;
利用预设算法对所述多个视频帧的图像特征向量进行运算处理,得到所述原始视频的第一预设维度的图像特征向量。
可选地,在对所述原始视频数据进行解码,得到多个视频帧之后,还包括:
按照预定时间间隔从所述多个视频帧中抽取n个视频帧;
将所述多个视频帧中的每一视频帧输入卷积神经网络CNN进行图像特征提取,得到每一视频帧的第二预设维度的图像特征向量,包括:
将所述n个视频帧中的每一视频帧输入CNN进行图像特征提取,得到每一视频帧对应的m维图像特征向量;
利用预设算法对所述多个视频帧的图像特征向量进行运算处理,得到所述原始视频的第一预设维度的图像特征向量,包括:
将n个所述m维图像特征向量按时间顺序连接,得到一n×m维图像特征向量;
对所述n×m维图像特征向量进行降维分析,得到所述原始视频的最终的第一预设维数的图像特征向量,其中,n和m为大于1的自然数。
可选地,对所述n×m维图像特征向量进行降维分析,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三六零科技集团有限公司,未经三六零科技集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811400848.8/2.html,转载请声明来源钻瓜专利网。