[发明专利]一种视频搜索方法、装置、电子设备及存储介质在审
| 申请号: | 202011435405.X | 申请日: | 2020-12-10 |
| 公开(公告)号: | CN114625916A | 公开(公告)日: | 2022-06-14 |
| 发明(设计)人: | 申世伟 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
| 主分类号: | G06F16/735 | 分类号: | G06F16/735;G06F16/738;G06F16/783;G06N20/00 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;贾允 |
| 地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 视频 搜索 方法 装置 电子设备 存储 介质 | ||
本公开关于一种视频搜索方法、装置、电子设备及存储介质。方法包括:接收携带有搜索语料的搜索请求;当搜索语料包括指示异常文本的至少一个目标语料片段时,以至少一个目标语料片段作为搜索对象,得到第一候选视频序列;在第一候选视频序列确定至少一个参考视频;计算每个参考视频对应的异常值;根据各个参考视频对应的异常值计算过滤阈值;以搜索语料为搜索对象,得到第二候选视频序列;基于过滤阈值对第二候选视频序列进行过滤,得到搜索请求对应的搜索结果。本公开结合目标语料片段的异常文本属性和参考视频的异常值来确定针对搜索语料的过滤阈值。利用过滤阈值过滤第二候选视频序列,对异常内容进行有效过滤以减少搜索结果中异常视频的聚集。
技术领域
本公开涉及互联网通信技术领域,尤其涉及一种视频搜索方法、装置、电子设备及存储介质。
背景技术
随着互联网通信技术的发展,基于输入的搜索对象,视频搜索系统可以向用户返回对应的搜索反馈,搜索反馈中可以包括相关的某一类或者各类媒体内容(比如视频、短视频、音频、图像、文本等等)。
返回的搜索反馈往往包括有异常内容,甚至会出现异常内容聚集的情形。异常内容可以是不符合法律、行政法规规定的内容,可以是违反社会公德的内容,还可以是损害国家利益、社会公共利益、第三人利益的内容。相关技术中,在处理返回的搜索反馈时,常采用一个固定的异常内容评估阈值,将大于该异常内容评估阈值的内容从搜索反馈中过滤掉,以得到搜索结果。这样在面对不同搜索对象所对应的搜索反馈时,搜索结果中容易出现将非异常内容过滤、没能将异常内容过滤掉的情形。因此,需要对异常内容进行有效过滤的视频搜索方案。
发明内容
本公开提供一种视频搜索方法、装置、电子设备及存储介质,以至少解决相关技术中缺乏对异常内容有效过滤的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种视频搜索方法,所述方法包括:
接收携带有搜索语料的搜索请求;
当所述搜索语料包括指示异常文本的至少一个目标语料片段时,以所述至少一个目标语料片段作为搜索对象,得到第一候选视频序列;
在所述第一候选视频序列确定至少一个参考视频;
计算每个所述参考视频对应的异常值;
根据各个所述参考视频对应的异常值计算过滤阈值;
以所述搜索语料为搜索对象,得到第二候选视频序列;
基于所述过滤阈值对所述第二候选视频序列进行过滤,得到所述搜索请求对应的搜索结果。
在一示例性的实施方式中,所述根据各个所述参考视频对应的异常值计算过滤阈值,包括:
对各个所述参考视频对应的异常值按照降序进行排列,得到异常值序列;
获取第一目标值M;
将所述异常值序列中的第M个异常值作为所述过滤阈值。
在一示例性的实施方式中,所述获取第一目标值M,包括:
获取比例因子和所述异常值序列中元素的个数;
将所述比例因子与所述异常值序列中元素的个数的乘积作为所述第一目标值M。
在一示例性的实施方式中,所述基于所述过滤阈值对所述第二候选视频序列进行过滤,得到所述搜索请求对应的搜索结果,包括:
计算所述第二候选视频序列中每个第二候选视频对应的异常值;
过滤掉所述第二候选视频序列中对应异常值大于所述过滤阈值的第二候选视频,得到所述搜索请求对应的搜索结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011435405.X/2.html,转载请声明来源钻瓜专利网。





