[发明专利]基于语音分析的视频搜索方法、设备及系统在审
申请号: | 201410014577.8 | 申请日: | 2014-01-13 |
公开(公告)号: | CN103778204A | 公开(公告)日: | 2014-05-07 |
发明(设计)人: | 崔代超 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京智汇东方知识产权代理事务所(普通合伙) 11391 | 代理人: | 薛峰;康正德 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语音 分析 视频 搜索 方法 设备 系统 | ||
1.一种基于语音分析的视频搜索方法,包括以下步骤:
接收视频搜索请求;
提取所述视频搜索请求中的视频关键字;
利用所述视频关键字在视频资源库的语音文本索引集中进行搜索,获得匹配索引项;
提取出与所述匹配索引项对应的目标视频资源的信息;以及
根据所述目标视频资源的信息绘制搜索结果;
其中,所述语音文本索引集中的索引项是基于对所述视频资源库中视频资源的伴音数据进行语音识别所获得的文本数据构建索引而形成的。
2.根据权利要求1所述的视频搜索方法,其中,
形成所述语音文本索引集中的索引项包括:
获取待处理的视频资源;
从所述待处理的视频资源中分离出伴音数据;
对分离出的所述伴音数据进行语音识别,解析为文本数据;以及
对解析出的所述文本数据构建索引,形成与所述待处理的视频资源关联的索引项。
3.根据权利要求2所述的视频搜索方法,其中,
获取待处理的视频资源包括:
存储所述待处理的视频资源的URL地址。
4.根据权利要求2所述的视频搜索方法,其中,
对分离出的所述伴音数据进行语音识别,解析为文本数据包括:
对所述伴音数据进行语句分割,并将分割出的每条语句解析为一条文本数据并存储。
5.根据权利要求4所述的视频搜索方法,其中,
在存储每条所述文本数据时,还存储该条文本数据在所述伴音数据中对应的语句相对于视频时间起始点所处的时间位置。
6.根据权利要求1所述的视频搜索方法,其中,
提取出的所述目标视频资源的信息包括所述目标视频资源的URL地址、所述匹配索引项对应的文本数据、以及所述匹配索引项对应的时间位置。
7.根据权利要求1所述的视频搜索方法,其中,
绘制所述搜索结果包括绘制所述目标视频资源在所述匹配索引项对应的时间位置处的视频截图。
8.一种基于语音分析的视频搜索客户端,包括:
搜索请求接收模块,配置为接收视频搜索请求;
关键字提取模块,配置为提取所述视频搜索请求中的视频关键字;
搜索模块,配置为利用所述视频关键字在视频资源库的语音文本索引集中进行搜索,获得匹配索引项;
信息提取模块,配置为提取出与所述匹配索引项对应的目标视频资源的信息;以及
绘制模块,配置为根据所述目标视频资源的信息绘制搜索结果;
其中,所述语音文本索引集中的索引项是基于对所述视频资源库中视频资源的伴音数据进行语音识别所获得的文本数据构建索引而形成的。
9.一种服务器,包括:
视频资源获取模块,配置为获取待处理的视频资源;
伴音数据分离模块,配置为从所述待处理的视频资源中分离出伴音数据;
伴音数据解析模块,配置为对分离出的所述伴音数据进行语音识别,解析为文本数据;以及
索引构建模块,配置为对解析出的所述文本数据构建索引,形成与所述待处理的视频资源关联的索引项;
语音文本索引集,配置为存储所述索引构建模块形成的索引项。
10.一种视频搜索系统,包括权利要求8所述的基于语音分析的视频搜索客户端,以及,权利要求9所述的服务器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410014577.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能井盖管理系统及方法
- 下一篇:可变翼卐字形风车