[发明专利]基于深度学习的视频搜索方法、存储介质、设备及系统有效
| 申请号: | 201810155479.4 | 申请日: | 2018-02-23 |
| 公开(公告)号: | CN108460122B | 公开(公告)日: | 2021-09-07 |
| 发明(设计)人: | 刘宇超;张文明;陈少杰 | 申请(专利权)人: | 武汉斗鱼网络科技有限公司 |
| 主分类号: | G06F16/732 | 分类号: | G06F16/732;G06F16/783;G06F16/71 |
| 代理公司: | 武汉智权专利代理事务所(特殊普通合伙) 42225 | 代理人: | 张凯 |
| 地址: | 430000 湖北省武汉市东湖开*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 深度 学习 视频 搜索 方法 存储 介质 设备 系统 | ||
本发明公开了一种基于深度学习的视频搜索方法、存储介质、设备及系统,涉及软件工程领域,该方法包括在直播的每个视频分类中均选取设定数量的样本;将所有样本输入NeuralTalk2中进行训练学习,得到训练后的深度学习模型;将直播所有视频的画面输入深度学习模型中,深度学习模型对输入的每一个画面所含内容输出描述;对深度学习模型输出的每个视频所有画面的描述进行统计,将出现频率较高的至少一个描述作为当前视频的索引;当用户搜索时,根据用户输入的关键词匹配含有该关键词的索引,并将索引对应视频作为搜索结果展出。本发明能够有效提升用户搜索直播视频结果的准确性。
技术领域
本发明涉及软件工程领域,具体涉及一种基于深度学习的视频搜索方法、存储介质、设备及系统。
背景技术
当前,直播行业飞速发展,人们通过智能移动设备便能便捷的观看到内容各式各样的直播,极大地充实了人们的业余生活。
由于直播内容形式的多种多样,导致直播视频和普通视频、图文存在诸多不一样的地方,其中一个区别最大的便是直播行业所生成的视频,其文字描述较少,由于直播视频的文字描述较少,从而导致用户在使用直播网站的搜索功能进行直播视频的搜索时,很难搜索到相关直播视频。
发明内容
针对现有技术中存在的缺陷,本发明的目的在于提供一种基于深度学习的视频搜索方法,能够有效提升用户搜索直播视频结果的准确性。
为达到以上目的,本发明采取的技术方案是,包括:
在直播的每个视频分类中均选取设定数量的样本,所述样本为视频的帧画面,且每个样本标记有该帧画面的所属分类和该帧画面中所含内容的短语描述;
将所有样本输入NeuralTalk2中进行训练学习,得到训练后的深度学习模型;
将直播所有视频的帧画面输入深度学习模型中,深度学习模型对输入的每一帧画面所含内容输出内容相应的描述;
对深度学习模型输出的每个视频所有画面的描述进行统计,并将出现频率较高的描述中的至少一个描述作为当前视频的索引;
当用户搜索时,根据用户输入的关键词匹配含有该关键词的索引,并将索引对应视频作为搜索结果展出。
在上述技术方案的基础上,
所述直播的视频分类包括户外类、游戏类和唱歌跳舞类。
在上述技术方案的基础上,所述深度学习模型对输入的每一个帧画面所含内容输出的描述为当前画面所含内容的短语描述。
在上述技术方案的基础上,将直播的每一个视频,每间隔一设定时间采样一帧画面作为当前视频的输入样本,然后将输入样本输入深度学习模型中,深度学习模型对每个输入样本画面所含内容输出描述。
在上述技术方案的基础上,对深度学习模型输出的每个视频的输入样本画面的描述进行统计并依出现频率高低排序,按出现频率高低顺序将至少一个描述作为当前视频的索引。
本发明还提供一种存储介质,该存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述所述的方法。
本发明还提供一种设备,包括存储器和处理器,存储器上储存有在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述所述的方法。
本发明还提供一种基于深度学习的视频搜索系统,包括:
取样模块,其用于在直播的每个视频分类中均选取设定数量的样本,所述样本为视频的帧画面,且每个样本标记有该帧画面的所属分类和该帧画面中所含内容的短语描述;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉斗鱼网络科技有限公司,未经武汉斗鱼网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810155479.4/2.html,转载请声明来源钻瓜专利网。





