[发明专利]一种重复视频的确定方法及装置有效
申请号: | 201810706019.6 | 申请日: | 2018-06-26 |
公开(公告)号: | CN108875062B | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 李娜 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F16/73 | 分类号: | G06F16/73;G06F16/74 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张建;王宝筠 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 重复 视频 确定 方法 装置 | ||
1.一种重复视频的确定方法,其特征在于,所述方法包括:
获取至少两个视频各自对应的至少两种视频信息;
比较所述至少两个视频的所述至少两种视频信息,获得比较结果;
根据所述比较结果确定所述至少两个视频中的重复视频;
其中,所述比较所述至少两个视频的所述至少两种视频信息,获得比较结果,包括:
在各所述视频信息中选取任一视频信息作为基准信息,依据所述基准信息对各视频进行分组,得到待比较视频组;
重复的以各所述视频信息中尚未作为基准信息使用的任一视频信息作为基准信息对各所述待比较视频组进行分组,直至遍历全部所述视频信息,得到比较结果。
2.根据权利要求1所述的方法,其特征在于,所述比较所述至少两个视频的所述至少两种视频信息,获得比较结果,包括:
按照预设的视频信息比较序列,依次选取所述序列中的第i种视频信息,其中,第i种视频信息为所述序列中排序为i的视频信息;
在第i种视频信息为第一种视频信息的情况下,确定所述至少两个视频各自对应的第一种视频信息之间是否满足第一条件,将彼此的第一种视频信息均满足所述第一条件的各视频确定为一个待比较视频组;
在第i种视频信息为第二种视频信息至第N-1种视频信息中的任意一种视频信息时,对每个根据第i-1种视频信息确定的待比较视频组:确定该待比较视频组中的各视频各自对应的第i种视频信息之间是否满足第i条件,将该待比较视频组中彼此的第i种视频信息均满足所述第i条件的各视频分别确定为一个待比较视频组,其中,i为自然数;
在第i种视频信息为第N种视频信息时,对每个根据第N-1种视频信息确定的待比较视频组:确定该待比较视频组中的各视频各自对应的第N种视频信息之间是否满足第N条件,将该待比较视频组中彼此的第N种视频信息均满足所述第N条件的各视频分别确定为一个重复视频组,其中,N为自然数;
将所述重复视频组确定为比较结果。
3.根据权利要求2所述的方法,其特征在于,所述根据所述比较结果确定所述至少两个视频中的重复视频,包括:
将所述重复视频组中的视频确定为重复视频。
4.根据权利要求1所述的方法,其特征在于,所述比较所述至少两个视频的所述至少两种视频信息,获得比较结果,包括:
对所述至少两种视频信息中的每一种视频信息:确定所述至少两个视频中各视频的该种视频信息之间是否满足与该种视频信息对应的条件,将确定结果作为比较结果。
5.根据权利要求4所述的方法,其特征在于,所述根据所述比较结果确定所述至少两个视频中的重复视频,包括:
将彼此的所述至少两种视频信息中的各种视频信息均满足对应的条件的视频确定为重复视频。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述至少两种视频信息包括:
视频标题、视频时长、视频发布时间和视频缩略图中的至少两种。
7.根据权利要求6所述的方法,其特征在于,在所述至少两种视频信息包括视频标题时,在所述比较所述至少两个视频的所述至少两种视频信息,获得比较结果之前,所述方法还包括:对获取的每个视频的视频标题:
对该视频的视频标题进行分词,获得多个词组;
将获得的多个词组中词组类型为预设类型的词组删除,按照预设排列顺序将剩余的词组进行排列,获得字符串;
将所述字符串确定为该视频的视频标题。
8.根据权利要求6所述的方法,其特征在于,在所述至少两种视频信息包括视频缩略图时,所述比较所述至少两个视频的所述至少两种视频信息,获得比较结果,包括:
计算获取的各视频缩略图的哈希值;
比较获取的各视频缩略图的哈希值,获得缩略图比较结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810706019.6/1.html,转载请声明来源钻瓜专利网。