[发明专利]一种基于双数组字典树进行术语匹配的方法有效
| 申请号: | 201610897567.2 | 申请日: | 2016-10-15 |
| 公开(公告)号: | CN106649286B | 公开(公告)日: | 2019-07-02 |
| 发明(设计)人: | 冯泽康 | 申请(专利权)人: | 语联网(武汉)信息技术有限公司 |
| 主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/27;G06F16/33 |
| 代理公司: | 江苏法德永衡律师事务所 32305 | 代理人: | 刘林 |
| 地址: | 430073 湖北省武汉市东湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 一种基于双数组字典树进行术语匹配的方法,其特征是包括建索引的步骤,及用索引进行术语查询匹配的步骤;其中,所述建索引的步骤如下:生成双数组字典树的定位,计算内存缓存系统的二级索引的ID,对术语建索引,所述用索引进行术语查询匹配的步骤如下:生成双数组字典树的定位,分词,基于索引进行术语匹配。既可以满足术语匹配的多种查询需求,又提高了整体匹配的性能。 | ||
| 搜索关键词: | 一种 基于 双数 字典 进行 术语 匹配 方法 | ||
【主权项】:
1.一种基于双数组字典树进行术语匹配的方法,其特征是包括用双数组字典树建索引的步骤,及基于双数组字典树索引进行术语匹配的步骤;所述用双数组字典树建索引的步骤包括:(1)生成双数组字典树的定位根据指定的双数组字典树的数目,用哈希算法,对插入术语计算哈希值,然后对双数组字典树的数目取模,计算得出双数组字典树的位置编号,用以实现双数组字典树的定位;(2)计算内存缓存系统的二级索引的ID从mongo数据库里读出术语,将术语插入双数组字典树,返回术语在双数组字典树的pos值,将所述双数组字典树的位置编号,乘以1000万,加上所述pos值,再配合程序设定的前缀字串,得出内存缓存系统里的二级索引的ID;(3)对术语建索引根据二级索引的ID查询出插入术语在数据库里对应的数据记录的术语库ID和对象ID,用术语库ID和对象ID构造键值,形成二级索引的ID和键值的映射关系,存放于内存缓冲系统;所述基于双数组字典树索引进行术语匹配的步骤包括:(1)生成双数组字典树的定位(2)分词将标点符号滤掉,对于西方语言直接按空格拆分,对于中文系列的语言按单个字拆分,用逆向最大匹配算法结合双数组字典,分出词汇,以及词汇在双数组字典树里的位置;(3)基于索引进行术语匹配根据二级索引的ID查询插入术语在数据库里对应的数据记录的术语库ID和对象ID,过滤并查询出插入术语在数据库的完整信息。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于语联网(武汉)信息技术有限公司,未经语联网(武汉)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610897567.2/,转载请声明来源钻瓜专利网。
- 上一篇:椅子(MK‑705)
- 下一篇:椅子(MK‑701)





