[发明专利]一种数据处理方法、装置和电子设备有效
| 申请号: | 201910390271.5 | 申请日: | 2019-05-10 |
| 公开(公告)号: | CN110232137B | 公开(公告)日: | 2021-09-03 |
| 发明(设计)人: | 徐德立;姜峰 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
| 主分类号: | G06F16/783 | 分类号: | G06F16/783;G06F16/738;G06F16/735;G06F16/71;G06F40/289 |
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据处理 方法 装置 电子设备 | ||
本申请实施例提供了一种数据处理方法、装置和电子设备,其中,所述方法包括:接收搜索信息;确定所述搜索信息中客观类字段和主观类字段;依据所述客观类字段从预设数据库的索引信息中选取候选索引信息,所述预设数据库包括视频数据的关联信息和所述关联信息对应的索引信息;获取候选索引信息对应的关联信息,依据所述主观类字段和每条候选索引信息对应的关联信息,确定目标索引信息;依据目标索引信息,提取所述目标索引信息对应的关联信息,构建目标视频搜索结果,并返回;从而通过多次筛选,提高视频搜索结果的准确性;且用于筛选的预设数据库是依据视频数据的关联信息建立的,可以提高视频搜索结果的准确性;从而提高了视频搜索效率。
技术领域
本申请涉及数据处理技术领域,特别是涉及一种数据处理方法、装置和电子设备。
背景技术
随着互联网技术的不断发展,以及搜索引擎技术的发展,用户可以通过搜索平台进行信息搜索,例如视频搜索、音乐搜索、论文搜索、图片搜索等等。
在视频搜索的过程中,搜索引擎通常将搜索词与索引库进行匹配,查找对应的视频搜索结果并返回;其中,该索引库通常保存的是页面的内容中的高频词,如名称。但用户在搜索的过程中,通常会输入其他的搜索词,如年份、国别等;导致依据现有的索引库进行搜索得到的搜索结果准确性差,且当返回的视频搜索结果不满足用户需求时,需要用户重新搜索,搜索效率低。
发明内容
本申请实施例提供一种数据处理方法,以提高视频搜索的准确性和效率。
相应的,本申请实施例还提供了一种数据处理装置和一种电子设备,用以保证上述方法的实现及应用。
为了解决上述问题,本申请实施例公开了一种数据处理方法,包括:接收搜索信息;确定所述搜索信息中客观类字段和主观类字段;依据所述客观类字段从预设数据库的索引信息中选取候选索引信息,其中,所述预设数据库包括视频数据的关联信息和所述关联信息对应的索引信息;获取所述候选索引信息对应的关联信息,依据所述主观类字段和每条候选索引信息对应的关联信息,确定目标索引信息;依据所述目标索引信息,提取所述目标索引信息对应的关联信息,构建目标视频搜索结果,并返回。
可选地,所述关联信息包括基础关联信息和扩展关联信息;所述基础关联信息包括客观类基础信息,所述扩展关联信息包括主观类信息和客观类扩展信息。
可选地,所述方法还包括:从所述视频数据的基础关联信息中选取一项或多项作为所述视频数据的索引信息;建立所述视频数据的索引信息与关联信息之间的关联,保存在所述预设数据库中。
可选地,所述获取所述候选索引信息对应的关联信息,依据所述主观类字段和每条候选索引信息对应的关联信息,确定目标索引信息,包括:依据所述候选索引信息,从预设数据库中提取出每个候选索引信息对应的扩展类关联信息;将所述搜索信息中包括的主观类字段分别与每个候选索引信息对应的扩展类关联信息中包括的主观类信息相匹配,将匹配度高于预设信息匹配阈值的主观类信息对应的候选索引信息作为所述目标索引信息。
可选地,所述方法还包括:将所述预设数据库划分为基础数据库和扩展数据库;建立所述基础关联信息和所述索引信息的关联关系,并将所述基础关联信息和所述索引信息存储至所述基础数据库中;针对每条视频数据,建立所述视频数据的扩展关联信息与所述索引信息之间的关联标签,保存在所述基础数据库中;将所述扩展关联信息存储至所述扩展数据库中。
可选地,所述获取所述候选索引信息对应的关联信息,依据所述主观类字段和每条候选索引信息对应的关联信息,确定目标索引信息,包括:依据所述候选索引信息,从所述基础数据库中查找到所述候选索引信息对应的关联标签;通过所述关联标签从所述扩展数据库中找到所述候选索引信息对应的扩展关联信息;将所述搜索信息中包括的主观类字段分别与每个所述候选索引信息对应的扩展关联信息中包括的主观类信息相匹配,将匹配度高于预设信息匹配阈值的主观类信息对应的候选索引信息作为所述目标索引信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910390271.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于云计算的大数据处理系统
- 下一篇:一种业务引导方法、装置及存储介质





