[发明专利]一种视频资源的识别和聚合的方法及系统在审
申请号: | 201711420821.0 | 申请日: | 2017-12-25 |
公开(公告)号: | CN108012192A | 公开(公告)日: | 2018-05-08 |
发明(设计)人: | 李娜 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | H04N21/44 | 分类号: | H04N21/44;G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 资源 识别 聚合 方法 系统 | ||
本发明公开了一种视频资源的识别和聚合的方法及系统,通过接收待识别视频资源,根据预设影视特征库对待识别视频资源进行特征识别和抽取,构建与待识别视频资源对应的特征集;根据特征集通过预设影视资料索引服务表获取与特征集相似的N个影视资料候选集;采用预设算法计算待识别视频资源与每个影视资料候选集中的影视资料的相似分值;将相似分值中大于预设阈值,且相似分值最大的影视资料作为待识别视频资源的所属影视资料,将待识别视频资源与相似分值最大的影视资料的视频资源进行聚合操作。本发明可以识别未知的影视视频以及识别播放源,将相同视频资源的播放源聚合在一起给用户展现更丰富和规范的播放源。
技术领域
本发明涉及网络视频处理技术领域,特别是涉及一种视频资源的识别和聚合的方法及系统。
背景技术
影视视频是人们日常生活中广泛接触的一类视频资源,随着互联网的迅速发展,影视视频不只存在于传统广播电视系统中,也大量的出现在网络资源库中。对于影视视频搜索平台,为了提供更全的视频资源,因此需要收录多家视频站点的视频资源,但同一视频资源可能存在于不同的站点,例如“速度与激情”,优酷、腾讯等各家站点都有该视频资源,但是不同的站点视频的描述信息存在差异,因此,需要将不同站点的同一视频资源正确的聚合到一起,统一对外展示。除此之外,对于用户上传的分散的影视视频资源,视频资源描述质量较差,对外展现用户体验相对较差,所以需要将视频资源正确识别为某部影视剧,补充资源的相关信息,并与其他相同的播放源聚合在一起,因此,需要解决对未知播放资源的识别,以及相同视频资源及播放源的聚合。
目前对于视频资源的识别和聚合主要采用标题相似度来进行识别和聚合视频资源,在判断视频资源是否属于已有视频资料时,需要遍历视频资源库里所有的视频资源做比较才能判断,比较次数多,效率较低;而且对于同一视频资源各家站点的描述由于没有一个规范的描述存在差异,若以任一一家站点的描述作为基准都无法保证视频资源描述的准确性和完整性;且由于各家站点的视频资源的描述数据参差不齐,进行相似度计算时会因为基准数据的质量不同,导致不同的聚合结果,聚合的召回率低且正确率也不高。
发明内容
本发明的目的在于提出一种视频资源的识别和聚合的方法及系统,以实现对未知的影视视频进行识别,对不完善的视频资料进行补充再展现给用户;以及实现识别第三方站点的播放源,将相同的播放源聚合在一起,给用户展现更丰富的播放源。
为达到上述目的,本发明提供了以下技术方案:
一种视频资源的识别和聚合的方法,包括:
接收待识别视频资源,根据预设影视特征库对所述待识别视频资源进行特征识别和抽取,构建与所述待识别视频资源对应的特征集;
根据所述特征集通过所述预设影视资料索引服务表获取与所述特征集相似的N个影视资料候选集,其中,N为大于等于1的正整数;
采用预设算法计算所述待识别视频资源与每个所述影视资料候选集中的影视资料的相似分值;
将所述相似分值中大于预设阈值,且所述相似分值最大的影视资料作为所述待识别视频资源的所属影视资料,将所述待识别视频资源与所述相似分值最大的影视资料的视频资源进行聚合操作。
优选的,还包括:
将所述待识别视频资源与所述所属影视资料对应的播放源标记为相同的播放源,对所述播放源进行聚合并统一对外展示。
优选的,所述构建预设影视特征库,包括:
根据全网影视资料库和明星数据库建立标准影视信息候选库,并建立影视资料索引服务;
将所述标准影视信息库作为标准参照数据,提取影视剧信息的特征值;
以所述特征值构建预设影视特征库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711420821.0/2.html,转载请声明来源钻瓜专利网。