[发明专利]视频标签生成方法、装置、计算机设备和存储介质有效
申请号: | 201711430514.0 | 申请日: | 2017-12-26 |
公开(公告)号: | CN108009293B | 公开(公告)日: | 2022-08-23 |
发明(设计)人: | 薛成龙;史亚冰;梁海金;张扬 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/78 | 分类号: | G06F16/78 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 标签 生成 方法 装置 计算机 设备 存储 介质 | ||
本发明提出一种视频标签生成方法、装置、计算机设备和存储介质,其中,方法包括:根据视频的标题提取得到主题词,以及确定主题词所属的主题类别词,根据视频的标题进行页面搜索,得到多个匹配页面,从每一个匹配页面的内容中提取关键词,根据主题词,对关键词进行筛选,以保留与主题词不重复的关键词,根据主题词、主题类别词和保留的关键词,生成视频的标签。通过对视频标签进行页面检索,获取匹配页面,从匹配页面中提取关键词,并对关键词筛选,增加了视频资源的文本信息,丰富了生成的视频标签的内容和种类,解决了现有技术中,视频资源的文本信息较少,致使生成的视频标签种类较少,准确性较低的问题。
技术领域
本申请涉及视频处理技术领域,尤其涉及一种视频标签生成方法、装置、计算机设备和存储介质。
背景技术
随着网络多媒体技术的快速发展,互联网上的视频等多媒体内容的数量正在以指数级的速度迅猛增长。视频资源通过标签标注视频内容核心点以及用户关注的核心内容,随着视频资源的检索需求越来愈大,丰富视频标签的内容,提高视频标签的准确度显的尤为重要。
相关技术中,对于视频内容的标签标注,一种方法是通过固有的标签体系进行标注;另一种方法是利用视频资源的内容生成标签。第一种方法固有的标签数量有限,无法覆盖全网视频标签的需求。第二种方法,因视频资源携带的文本内容有限,可生成的标签的内容和类别有限,使得生成的视频标签数量较少,准确度较低的问题。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种视频标签生成方法,以实现通过对视频标签进行页面检索,获取匹配页面,从匹配页面中提取关键词,并对关键词筛选,使得筛选出的关键词增加了视频资源的文本信息,丰富了生成的视频标签的内容和种类,解决了现有技术中,视频资源的文本信息较少,致使生成的视频标签种类较少,准确性较低的问题。
本发明的第二个目的在于提出一种视频标签生成装置。
本发明的第三个目的在于提出一种计算机设备。
本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
本发明的第五个目的在于提出一种计算机程序产品。
为达上述目的,本发明第一方面实施例提出了一种视频标签生成方法,包括:
根据视频的标题提取得到主题词,以及确定所述主题词所属的主题类别词;
根据视频的标题进行页面搜索,得到多个匹配页面;
从每一个匹配页面的内容中提取关键词;
根据所述主题词,对所述关键词进行筛选,以保留与所述主题词不重复的关键词;
根据所述主题词、所述主题类别词和保留的关键词,生成所述视频的标签。
本发明实施例的一种视频标签生成方法中,根据视频的标题提取得到主题词,以及确定主题词所属的主题类别词,根据视频的标题进行页面搜索,得到多个匹配页面,从每一个匹配页面的内容中提取关键词,根据主题词,对关键词进行筛选,以保留与主题词不重复的关键词,根据主题词、主题类别词和保留的关键词,生成视频的标签。通过对视频标签进行页面检索,获取匹配页面,从匹配页面中提取关键词,并对关键词筛选,增加了视频资源的文本信息,丰富了生成的视频标签的内容和种类,解决了现有技术中,视频资源的文本信息较少,致使生成的视频标签种类较少,准确性较低的问题。
为达上述目的,本发明第二方面实施例提出了一种视频标签生成装置,包括:
主题提取模块,用于根据视频的标题提取得到主题词,以及确定所述主题词所属的主题类别词;
搜索模块,用于根据视频的标题进行页面搜索,得到多个匹配页面;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711430514.0/2.html,转载请声明来源钻瓜专利网。