[发明专利]TRIE树双数组的全局优化构造方法及系统无效
| 申请号: | 200910077848.3 | 申请日: | 2009-01-23 |
| 公开(公告)号: | CN101788990A | 公开(公告)日: | 2010-07-28 |
| 发明(设计)人: | 王晓春;王亚军 | 申请(专利权)人: | 北京金远见电脑技术有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | trie 双数 全局 优化 构造 方法 系统 | ||
1.一种TRIE树双数组的全局优化构造方法,其特征在于,包括:
步骤1:用二进制位串来表示TRIE树结构中的每个结点,其中每个所述二进制位串中从左到右的每一位都一一对应每个结点中的每一个子结点,1表示含有子结点,0表示不含子结点,然后将每个所述二进制位串右移,直到第0位为1,并分别记录移位后的二进制表示和移位位数;
步骤2:将TRIE树中的所有结点按照结点的二进制表示映射到相应的类;
步骤3:确定TRIE树中各个结点在双数组中存放的先后顺序,并记录每个结点在双数组中的转移基值;以及
步骤4:依据存储在每个结点中的所述转移基值、TRIE树中各个结点间的父子关系、以及每个子结点所对应的转移步长,设置check和base数组。
2.根据权利要求1所述的TRIE树双数组的全局优化构造方法,其特征在于,在所述步骤2中,对于每个结点的移位后二进制表示,如果存在一个k,使得第k位及其右侧的所有比特位都为1,而第k位左侧的比特位均为0,则令其属于class 1类,否则属于class 2类。
3.根据权利要求2所述的TRIE树双数组的全局优化构造方法,其特征在于,还包括:对于Class 1中的每个结点,按照其二进制位串中比特位为1的个数进行继续分类,此时最大分类数为M,其中M为词典中构成词的基本元素数。
4.根据权利要求2所述的TRIE树双数组的全局优化构造方法,其特征在于,还包括:对于class2中的每个结点,将其二进制位串右移一位后,从第0位开始取N位,依据其值分别映射到0~2N-1个桶中,以将class 2中结点分为2N个类。
5.根据权利要求1至4中任一项所述的TRIE树双数组的全局优化构造方法,其特征在于,在所述步骤3中,把TRIE树中的所有结点的二进制位串进行按位与运算以使所有结点的子结点在线性空间内相互交叠,而不发生空间占用冲突,其中所述与运算的结果为0表示不发生冲突,以及进行按位或运算来表示最后空间的占用情况。
6.根据权利要求5所述的TRIE树双数组的全局优化构造方法,其特征在于,在所述步骤3中还包括:从左到右采用启发式贪婪算法、利用当前双数组中空间的占用情况,逐步计算TRIE树双数组中当前应存放的下一个最优结点。
7.根据权利要求6所述的TRIE树双数组的全局优化构造方法,其特征在于,所述步骤3还包括:设计了一个待优化结构waitForOptimatic,用来暂存TRIE树双数组中当前需要优化的部分,用一个第0位为0的二进制位串来表示,其中每一位二进制数表示一个存放位置,对应于每一个子结点,1表示此位置已经存放了一个结点,0表示此位置到目前为止还没有被占用,只对比特位为0的位置进行优化,并用一个变量记录当前待优化结构在TRIE树双数组中对应的起始位置pos。
8.根据权利要求7所述的TRIE树双数组的全局优化构造方法,其特征在于,所述步骤3还包括:如果waitForOptimatic为0,则优先选择所述class 2类中分支最多的结点T作为当前最优结点,并令waitForOptimatic=BT,以及将waitForOptimatic右移k位,使得waitForOptimatic的第0位为0;如果waitForOptimatic不为0,则在waitForOptimatic&BT=0的结点中选择分支最多的结点作为最优选择结点,其中BT表示结点的二进制位串以及&表示按位与。
9.根据权利要求8所述的TRIE树双数组的全局优化构造方法,其特征在于,所述步骤3中还包括,利用waitForOptimatic的第1位到第N+1位来确定最优结点所属的类别,并在此类别中确定最优结点,当此类别为空则向前类别号低的方向寻找。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金远见电脑技术有限公司,未经北京金远见电脑技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910077848.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:经文保综合管理信息系统及方法
- 下一篇:多点分层型差动激光多普勒测速仪





