[发明专利]一种词条的存储和管理方法有效
申请号: | 201310540625.2 | 申请日: | 2013-11-04 |
公开(公告)号: | CN103559270A | 公开(公告)日: | 2014-02-05 |
发明(设计)人: | 高杰 | 申请(专利权)人: | 北京中搜网络技术股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京安博达知识产权代理有限公司 11271 | 代理人: | 徐国文 |
地址: | 100191 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 词条 存储 管理 方法 | ||
技术领域
本发明涉及一种计算机领域的管理方法,具体讲涉及一种词条的存储和管理方法。
背景技术
互联网提供了即时丰富的人与人沟通参与/娱乐的平台信息,深层影响着现代人的生活。但随着网站数量和内容的急增,互联网就像是没有目录的巨大百科全书,让人们无法找寻自己想要的信息。搜索引擎的出现,使这本百科全书有了目录和索引。不论想从互联网中寻找什么内容,只需要在搜索框中敲入关键词汇,就能够获得相关的信息或网址。
搜索引擎是对计算机科学与技术的极大发展,将理论研究和工程开发完美结合,创造了非凡的用户体验和文化。以Google为代表的传统搜索引擎,在用户输入一个查询词时,返回和此查询词相关的网页摘要,并尽可能将用户需要的结果排在了前面。但搜索引擎毕竟不会“猜心术”,对于一个词,用户会有不同的需求,如对于“绿茶”,可能是茶文化、健康知识、电影介绍、化妆品或者其他。大多数用户并不能够通过一两个词,精确表达自己所想要的内容,搜索引擎也无能为力只有返回大量的结果供用户选择。这就产生了一个很大的问题,但结果量巨大到无限大的时候,就等于没有结果,如何解决这一问题,一些学者指出第三代搜索引擎的应该具备互动式搜索、分类导航、查询精确、更新速度快等特点。
而随着互联网时代的发展,每天都有各种各样重要新闻、网站的更新,如何实现快速高效的查询,如何实现精确的词条到网站搜索结果页(SRP,Search Result Page)的跳转是目前第三代搜索引擎需要克服的重点问题之一。
发明内容
为了克服上述现有技术的不足,本发明提供本发明提供了一种词条的存储管理方法。该方法通过对第三代搜索引擎的词条(包括主词、同义词、分义标注、SRP_ID等)的有效管理、分析及存储,满足高效的搜索检索页(SRP)的需求,实现数据读取更新的高效化和快速化。
实现上述目的所采用的解决方案为:
一种词条的存储和管理方法,其改进之处在于:所述方法包括:I、创建搜索结果页对应的词条;
II、提交上线申请;
III、审核人员检查词条;
IV、搜索结果页对应词条上线并存储于缓存;
V、读取缓存词条,定位搜索结果页。
进一步的,所述步骤I包括以下步骤:用户根据搜索结果页确定所述创建搜索结果页对应的词条;所述搜索结果页对应的词条提交上线。
进一步的,所述词条包括关键词、分义标注、搜索结果页的SRPID。
进一步的,所述关键词包括主词和同义词,所述主词和同义词中的任一对应唯一搜索结果页。
进一步的,所述步骤II包括以下步骤:S201、提交搜索结果页及其对应词条;
S202、在已有的词库中查找是否存在相同主词,存在则进入步骤S203,否则提交上线;
S203、判断是否存在与所述主词同义的词,若存在则建立同义词;否则进入步骤S204;
S204、建立主词的分义标注,根据所述关键词对应的多个所述搜索结果页的SRPID,创建消歧义页面,消除不同条目拥有相同名称一词多义所引起的歧义,供用户选择;
S205、提交上线。
进一步的,所述步骤III包括:审核人员接收所述搜索结果页及其对应的词条,判断是否合格,合格则添加并存储于缓存的对应关键词区,不合格则修改或删除。
进一步的,所述添加包括,在缓存中的词条区中,根据词条的关键词查找词条表,判断词条是否存在,不存在则创建词条,更新词条表。
所述修改包括,在缓存中的词条表区中,根据词条的关键词查找词条表,遍历出需要修改的词条,修改词条中的信息,更新词条表。
所述删除包括,在缓存中的词条区中,根据词条的关键词查找词条表,遍历出需要删除的词条,删除所述词条,更新词条表。
进一步的,所述更新包括,删除缓存中的词条表,添加新的词条表。
进一步的,存储所述词条的信息的词条表,包括词条长度、主词、主词ID、分类ID、分类长度、搜索检索页的SRPID、分义标注、分义标注长度;
根据所述关键词搜索词条表获得所述搜索检索页的SRPID,根据所述搜索结果页的SRPID获得对应的搜索检索页。
进一步的,所述关键词与其对应的词条基于hash算法存储于缓存中,所述关键词为键,所述词条为值;
所述搜索检索页的SRPID与其对应的搜索检索页基于hash算法存储于缓存中,所述搜索检索页的SRPID为键,所述搜索检索页为值。
与现有技术相比,本发明具有以下有益效果:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中搜网络技术股份有限公司,未经北京中搜网络技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310540625.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种具有位结构的冲压装置
- 下一篇:冲压板的定位结构