[发明专利]一种构建索引树的方法、汉语词汇搜索的方法及相关装置在审
| 申请号: | 201310459945.5 | 申请日: | 2013-09-29 |
| 公开(公告)号: | CN103514287A | 公开(公告)日: | 2014-01-15 |
| 发明(设计)人: | 李勇 | 申请(专利权)人: | 深圳市龙视传媒有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 构建 索引 方法 汉语 词汇 搜索 相关 装置 | ||
1.一种构建索引树的方法,其特征在于,
建立关键词及所述关键词对应的索引信息,所述关键词包含至少一个汉字;
将所述关键词按照五笔字根拆分成第一字根序列;
根据第一字根序列在预先创建的索引树中查找,判断索引树中是否存在从根节点出发且经过的节点所组成的字根序列与第一字根序列相匹配的路径;
若不存在,则获取第一字根序列在索引树中的最后匹配节点,在所述最后匹配节点下为尚未匹配成功的字根序列创建对应的子索引树,将所述关键词与所述关键词对应的索引信息存储到子索引树的最后一个节点中;
所述索引树为N叉树,除根节点外的每个节点包含一字根集,所述字根集内的字根具有相同的五笔序号。
2.如权利要求1所述的方法,其特征在于,当判断索引树中存在从根节点出发且经过的节点所组成的字根序列与第一字根序列相匹配的路径,则所述方法还包括:
获取第一字根序列在索引树中的最后匹配节点;
判断所述最后匹配节点中是否存储有所述关键词与所述关键词对应的索引信息;
若否,则将所述关键词与所述关键词对应的索引信息存储到所述最后匹配节点中。
3.如权利要求1或2所述的方法,其特征在于,所述索引树的节点包含五笔序号、字根表以及子节点链接表,其中,五笔序号为字根表中包含的字根对应的序号,字根表为字根序号和所述字根序号对应的字根在当前节点组成的关键词对应的索引表的映射表,子节点链接表为子节点的五笔序号和所述子节点的五笔序号对应的子节点链接地址的映射表。
4.如权利要求3所述的方法,其特征在于,所述根据第一字根序列在预先创建的索引树中查找,判断索引树中是否存在从根节点出发且经过的节点所组成的字根序列与第一字根序列相匹配的路径包括:
将索引树的根节点设为查找节点;
从第一字根序列中取出第一个字根作为查找字根;
判断所述查找节点的子节点链表中是否存在第一子节点,所述第一子节点的字根表中包含所述查找字根;
若是,将所述第一子节点设为查找节点,判断第一字根序列是否为空,若不为空,从第一字根序列中取出下一个字根作为查找字根,以此类推;若为空,将所述查找节点设为最后匹配节点,判断索引树中存在从根节点出发且经过的节点所组成的字根序列与第一字根序列相匹配的路径;
若否,将所述查找节点设为最后匹配节点,判断索引树中不存在从根节点出发且经过的节点所组成的字根序列与第一字根序列相匹配的路径。
5.如权利要求4所述的方法,其特征在于,所述获取第一字根序列在索引树中的最后匹配节点,在所述最后匹配节点下为尚未匹配成功的字根序列创建对应的子索引树,将所述关键词与所述关键词对应的索引信息存储到所述子索引树的最后一个节点中包括:
获取第一字根序列在索引树中的最后匹配节点;
将尚未匹配成功的字根序列设为第二字根序列;
从第二字根序列中取出第一个字根作为新增字根;
判断所述最后匹配节点的子节点链表中是否存在第二子节点,所述第二子节点的五笔序号为所述新增字根对应五笔序号;
若是,将所述新增字根添加到所述第二子节点的字根表中,将所述第二子节点设为最后匹配节点;
若否,在所述最后匹配节点下创建第三子节点,所述第三子节点的五笔序号为所述新增字根对应的五笔序号,并将所述新增字根添加到所述第三子节点的字根表中,将所述第三子节点设为最后匹配节点;
判断第二字根序列是否为空;
若不为空,则从第二字根序列中取出下一个字根作为新增字根,以此类推;
若为空,则将所述关键词与所述关键词对应的索引信息存储到所述最后匹配节点中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市龙视传媒有限公司,未经深圳市龙视传媒有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310459945.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:显示装置
- 下一篇:基于非对称耦合器交叉相位调制的全光逻辑器





