[发明专利]一种视频搜索系统和方法有效
| 申请号: | 202010088912.4 | 申请日: | 2020-02-12 |
| 公开(公告)号: | CN111324768B | 公开(公告)日: | 2023-07-28 |
| 发明(设计)人: | 杨丛聿;仇应俊 | 申请(专利权)人: | 新华智云科技有限公司 |
| 主分类号: | G06F16/732 | 分类号: | G06F16/732;G06F16/783 |
| 代理公司: | 杭州裕阳联合专利代理有限公司 33289 | 代理人: | 姚宇吉 |
| 地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 视频 搜索 系统 方法 | ||
1.一种视频搜索系统,其特征在于,包括:
获取模块;
处理模块;
排序模块;
其中所述获取模块获取视频,所述处理模块对获取的视频进行分段;所述排序模块根据视频发布时间、文本相关度对分段视频进行排序;
对分段视频排序包括如下方法:根据视频文本相关度采用BM25算法对视频排序,所述文本包括OCR图像识别获取的文本和ASR语音识别获取的文本,根据相关度大小从高到低排序;
对分段视频排序还包括如下方法:根据视频所处状态,对时间系数生成采用分段高斯衰减,公式如下:
x为视频发布时长,单位为(/天),F(x)为最大时间系数;
用于生成(0,2]区间的时间系数;
其中短期内热点视频初始时间系数为2,发酵周期内视频初始系数为1.5,历史视频时间系数为1;
所述视频根据时间生成的时间系数从大到小排序。
2.根据权利要求1所述一种视频搜索系统,其特征在于,所述处理模块还用于生成全局唯一的视频ID,所述视频ID包括总视频ID和分段视频ID,所述处理模块还用于提取视频基础信息,其中所述基础信息包括标题、时长、码率、简介、转存链接、宽度、高度、缩略图。
3.根据权利要求1所述一种视频搜索系统,其特征在于,所述处理模块包括人脸识别模块,OCR图片识别模块和ASR语音识别模块。
4.根据权利要求3所述一种视频搜索系统,其特征在于,所述处理模块用于对视频进行标签提取,根据视频中的图像信息和语音信息提取视频标签;所述处理模块优先根据ASR语音识别模块获取的语音信息对视频分段,其中所述语音信息包括句落、段落、同一对象完整的语音信息或同一事件完整语音信息。
5.根据权利要求3所述一种视频搜索系统,其特征在于,所述处理模块设立一分段阈值时长,当所述ASR语音识别模块未识别语音信息时,所述处理模块将视频信息以分段阈值时长为最大时长分段。
6.根据权利要求3所述一种视频搜索系统,其特征在于,所述处理模块包括一存储模块,所述存储模块采用ElasticSearch搜素引擎,并建立nested嵌套父子结构的索引存储,其中父结构中存储视频,子结构存储标签信息。
7.一种视频分段方法,包括如下步骤:
采集视频;
提取视频标签;
对视频分段,并建立分段视频索引;
对分段视频排序;
对分段视频排序包括如下方法:根据视频文本相关度采用BM25算法对视频排序,所述文本包括OCR图像识别获取的文本和ASR语音识别获取的文本,根据相关度大小从高到低排序;
对分段视频排序还包括如下方法:根据视频所处状态,对时间系数生成采用分段高斯衰减,公式如下:
x为视频发布时长,单位为(/天),F(x)为最大时间系数;
用于生成(0,2]区间的时间系数;其中短期内热点视频初始时间系数为2,发酵周期内视频初始系数为1.5,历史视频时间系数为1;
所述视频根据时间生成的时间系数从大到小排序。
8.根据权利要求7所述的一种视频分段方法,其特征在于,包括生成并提取分段视频标签,所述标签包括分段视频的开始时间、结束时间,分段视频内的人脸信息、事件信息以及语音信息,用于建立分段视频索引。
9.根据权利要求8所述的一种视频分段方法,其特征在于,采用ASR语音识别技术将音频信息转换为文本信息,根据文本信息识别人物、自然灾害、交通事故、热点事件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新华智云科技有限公司,未经新华智云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010088912.4/1.html,转载请声明来源钻瓜专利网。





