[发明专利]数据检索方法、数据检索引擎及嵌入式终端有效
申请号: | 200810240889.5 | 申请日: | 2008-12-26 |
公开(公告)号: | CN101770478A | 公开(公告)日: | 2010-07-07 |
发明(设计)人: | 吴跃进 | 申请(专利权)人: | 高德信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 检索 方法 引擎 嵌入式 终端 | ||
技术领域
本发明涉及数据检索技术领域,尤其涉及一种数据检索方法、数据检 索装置及嵌入式终端。
背景技术
20世纪80年代中后期以后,随着计算机处理能力的大大提高及使用的 逐步普及,数据检索技术的研究进入了一个快速发展的黄金期,各种数据 检索技术及实用化系统不断涌现。比如,文本检索技术,该技术改进和应 用了三种流行的数据检索模型:布尔模型、概率模型和向量空间模型。
发明人在对现有的文本检索技术研究和实践过程中,发现当用户输入 的汉字序列中汉字的相邻关系与目标数据不相符时,由于现有的文本检索 技术采用将汉字序列的内容与目标数据的内容进行匹配的方式,检索目标 数据,而没有从汉字序列的语义对检索到的目标数据加以分析,从而无法 保证从海量目标数据集内快速、准确地检索到目标数据。
发明内容
本发明实施例要解决的技术问题是提供一种数据检索方法、数据检索 装置及嵌入式终端,能够实现从海量目标数据集内准确地检索到目标数据。
为解决上述技术问题,本发明的目的是通过以下技术方案实现的:
本发明实施例提供了一种数据检索方法,该方法包括:
步骤一、接收用户输入的一个汉字,若所述汉字不是用户当前输入的 第一个汉字,而是第N个汉字,N≥2,则进入步骤二;
步骤二、从预先获取到的第N-1检索结果集中,读取分词子集合及其 所属目标数据;
步骤三、判断所述第N个汉字与所述分词子集合中分词的首字是否相 同,如果相同,则进入步骤四;
步骤四、将所述步骤二读取出的目标数据及分词子集合对应保存在第N 检索结果集中。
相应的,本发明实施例还提供了一种数据检索装置,该数据检索装置 包括:
汉字接收单元,用于接收用户输入的一个汉字;
汉字顺序判断单元,若判断得到所述汉字接收的汉字不是用户当前输 入的第一个汉字,而是第N个汉字,N≥2,则触发所述检索结果读取单元;
所述检索结果读取单元,用于从预先获取到的第N-1检索结果集,读 取分词子集合及其所属目标数据;
第一汉字匹配单元,用于判断所述第N个汉字与所述检索结果读取单 元读取出的分词子集合中分词的首字是否相同,如果相同,则触发第N检 索结果保存单元;
所述第N检索结果保存单元,用于将所述检索结果读取单元读取出的 目标数据及分词子集合对应保存在第N检索结果集中。
相应的,本发明实施例还提供了一种嵌入式终端,包括:前文已述的 任一一个数据检索装置。
上述技术方案具有如下有益效果:
本发明实施例提供了一种数据检索技术,该技术在接收到用户输入的 汉字后,先判断该汉字是不是用户当前输入的第一个汉字,如果不是第一 个汉字,则从预先获取到的第N-1检索结果集,读取分词子集合及其所属 目标数据,然后,判断所述第N个汉字与所述分词子集合中分词的首字是 否相同,如果相同,则将所述步骤二读取出的目标数据及分词子集合对应 保存在第N检索结果集中。由于该技术采用将用户输入的汉字与分词子集 合中分词的首字进行匹配的方式,从预先获取到的第N-1检索结果集中获 取更准确的目标数据,从而实现了从海量目标数据集内快速、准确地检索 到目标数据。
附图说明
图1为本发明第一实施例提供的数据检索方法流程图;
图2为本发明第二实施例提供的数据检索方法流程图;
图3为本发明第三实施例提供的多级检索索引构建方法流程图;
图4为本发明实施例提供的一级检索索引数据簇集示意图;
图5为本发明实施例提供的二级检索索引数据集示意图;
图6为本发明第四实施例提供数据检索装置组成示意图。
具体实施方式
为使本发明实施例的目的、技术方案、及优点更加清楚明白,以下参 照附图对本发明实施例提供的技术方案进行详细说明。
本发明第一实施例提供了一种数据检索方法,请参见图1,该方法包括 如下步骤:
步骤101:接收用户输入的一个汉字Chword,若所述汉字Chword不是用户 当前输入的第一个汉字,而是第N个汉字,N≥2,则进入步骤102;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高德信息技术有限公司,未经高德信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810240889.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:防反射层叠体
- 下一篇:实现派生构件回调事件过滤的方法和数据处理设备
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置