[发明专利]一种数据搜索中的纠错装置及其方法在审
| 申请号: | 201410447009.7 | 申请日: | 2014-09-03 | 
| 公开(公告)号: | CN104268157A | 公开(公告)日: | 2015-01-07 | 
| 发明(设计)人: | 关涛;于立柱 | 申请(专利权)人: | 乐视网信息技术(北京)股份有限公司 | 
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 | 
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 | 
| 地址: | 100089 北京市海淀区*** | 国省代码: | 北京;11 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 数据 搜索 中的 纠错 装置 及其 方法 | ||
1.一种数据搜索中的纠错装置,其特征在于,包括:
关键词统计模块,用于对所有搜索关键词进行统计,获得所述搜索关键词的第一特征;
关键词插入模块,用于将所述搜索关键词根据其第一特征插入到预先构建的分类数据结构中,所述分类数据结构的每个节点存放N个搜索关键词,所述N为大于或者等于1的自然数;
键值对应模块,用于分别对每个节点所存放的搜索关键词进行两两比较,根据比较结果,确定进行比较的两个搜索关键词中的错误的搜索关键词与对应的用于纠错的搜索关键词,并将所述错误的搜索关键词与对应的用于纠错的搜索关键词组成键值对;
纠错操作模块,用于对接收的搜索关键词根据所述键值对进行纠错操作处理。
2.根据权利要求1所述的装置,其特征在于,所述关键词统计模块还用于获得所述搜索关键词的搜索历史,所述搜索历史包括搜索次数和/或在原有键值对中作为错误的搜索关键词和作为用于纠错的搜索关键词的历史;
所述关键词插入模块根据所述搜索关键词的第一特征及搜索历史将其插入到所述分类数据结构中。
3.根据权利要求1或2所述的装置,其特征在于,所述分类数据结构为字典树。
4.根据权利要求3所述的装置,其特征在于,所述键值对应模块包括:
相似度计算单元,用于两两计算每个节点所存放的搜索关键词的相似度,将相似度低于第一预设阈值的两个关键词设置为第一关键词对;
键值确定单元,用于根据所述搜索关键词的搜索历史,确定所述第一关键词对中的错误的搜索关键词与对应的用于纠错的搜索关键词,并令所述错误的搜索关键词与对应的用于纠错的搜索关键词组成键值对。
5.根据权利要求4所述的装置,其特征在于,所述键值确定单元还用于计算所述错误的搜索关键词与对应的用于纠错的搜索关键词之间的错误度,如果所述错误度大于第二预设阈值,则令所述错误的搜索关键词与对应的用于纠错的搜索关键词组成键值对。
6.根据权利要求1所述的装置,其特征在于,还包括过滤处理模块,用于将所有键值对中用于纠错的搜索关键词为另一键值对中错误的搜索关键词的键值对滤除,并将滤除后的剩余键值对进行保存。
7.一种数据搜索中的纠错方法,其特征在于,包括:
对所有搜索关键词进行统计,获得所述搜索关键词的第一特征;
将所述搜索关键词根据其第一特征插入到预先构建的分类数据结构中,所述分类数据结构的每个节点存放N个搜索关键词,所述N为大于或者等于1的自然数;
分别对每个节点所存放的搜索关键词进行两两比较,根据比较结果,确定所述比较的两个搜索关键词中的错误的搜索关键词与对应的用于纠错的搜索关键词,并将所述错误的搜索关键词与对应的用于纠错的搜索关键词组成键值对;
对接收的搜索关键词根据所述键值对进行纠错操作处理。
8.根据权利要求7所述的方法,其特征在于,所述对所有搜索关键词进行统计,获得所述搜索关键词的第一特征还包括:获得所述搜索关键词的搜索历史,所述搜索历史包括搜索次数和/或在原有键值对中作为错误的搜索关键词和作为用于纠错的搜索关键词的历史;
所述将所述搜索关键词根据其第一特征插入到所述分类数据结构中为:根据所述搜索关键词的第一特征及搜索历史将其插入到所述分类数据结构中。
9.根据权利要求7或8所述的方法,其特征在于,所述分类数据结构为字典树。
10.根据权利要求9所述的方法,其特征在于,所述分别对每个节点所存放的搜索关键词进行两两比较,根据比较结果,确定所述比较的两个搜索关键词中的错误的搜索关键词与对应的用于纠错的搜索关键词,并将所述错误的搜索关键词与对应的用于纠错的搜索关键词组成键值对包括:
两两计算每个节点所存放的搜索关键词的相似度,将相似度低于第一预设阈值的两个关键词设置为第一关键词对;
根据所述搜索关键词的搜索历史,确定所述第一关键词对中的错误的搜索关键词与对应的用于纠错的搜索关键词,并令所述错误的搜索关键词与对应的用于纠错的搜索关键词组成键值对。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于乐视网信息技术(北京)股份有限公司,未经乐视网信息技术(北京)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410447009.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种木质汽车后备箱板
 - 下一篇:一种复杂矢量数据的地图快速绘制方法
 
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
 - 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
 - 数据发送方法、数据发送系统、数据发送装置以及数据结构
 - 数据显示系统、数据中继设备、数据中继方法及数据系统
 - 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
 - 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
 - 数据发送和数据接收设备、数据发送和数据接收方法
 - 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
 - 数据发送方法、数据再现方法、数据发送装置及数据再现装置
 - 数据发送方法、数据再现方法、数据发送装置及数据再现装置
 





