[发明专利]一种自动构建分布式分类搜索引擎的方法在审
申请号: | 201510921658.0 | 申请日: | 2015-12-14 |
公开(公告)号: | CN105574100A | 公开(公告)日: | 2016-05-11 |
发明(设计)人: | 黄理灿 | 申请(专利权)人: | 杭州域竹科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310018 浙江省杭州市杭州经济技*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 构建 分布式 分类 搜索引擎 方法 | ||
技术领域
信息技术,分布式分类搜索引擎。
背景技术
搜索引擎主要分为全文搜索引擎和目录分类搜索。全文搜索引擎是目前主流搜索 引擎,国外代表搜索是Google,国内是百度。全文搜索引擎利用“蜘蛛”(Spider)程序或“机 器人”(Robot)程序从互联网提取各个网站的信,建立起数据库。当用户以关键词查找信息 时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的 算法——通常根据网页中关键词的匹配程度、出现的位置、频次、链接质量——计算出各网 页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。
目录分类搜索按目录分类将网站进行分类链接。用户可以按照分类目录找到所需 要的信息,不依靠关键词进行查询。分类搜索如Yahoo、新浪分类等。与全文搜索引擎相比, 目录索引则完全依赖手工操作。这种引擎的特点是找的准确率比较高。
全文搜索引擎和目录分类搜索各有优缺点。目录索引则完全依赖手工操作,费时, 信息不全。当目录很长时,用户需要逐级查找下一级目录,用户体验差。但查找的准确率比 较高。全文搜索引擎属于自动网站检索。这种引擎的特点是搜全率比较高。但是查找的结果 不精确。当不知道关键词时,则不能搜索结果。用户如果清晰知道要查找的关键词,全文搜 索引擎是最好的选择,但用户不清晰知道要查找的关键词,则目录分类搜索适合用户。当用 户从天空看“森林“时,选择使用目录分类搜索,当用户查找具体的”树“时,全文搜索引擎是 好的选择。
目前的搜索引擎仅仅搜索网页的内容,对用户的本地信息则不能搜索。然而。用户 本地信息巨大,如何将用户本地的信息搜索出来,也是需要解决的课题。
本发明提出一种自动构建分布式分类搜索引擎的方法,解决以上两种搜索引擎存 在的以上问题。
发明内容
一种自动构建分布式分类搜索引擎的方法,其特征在于:1)建立具有根节点的信 息分类目录的步骤;2)对网站进行分布式信息采取并进行信息分类的步骤;3)用户自动将 本地计算机的信息发布到分类目录的步骤;4)用户采用语义P2P网络方式(专利:一种基于 p2p的查找有关节点子集合的方法CN200910096247.7)搜索加入领域的所有用户的信息 的步骤。
根据权利要求1所述的建立具有根节点的信息分类目录的步骤,自动建立全领域 的信息分类目录,涵盖社会、科学、技术、生活等各领域,这些目录从根节点到页节点逐步对 应详细的目录。
根据权利要求1所述的对网站进行分布式信息采取并进行信息分类的步骤,大量 计算机对网站进行分类信息抓取,可以人工设定信息分类和抓取模式,也可以对抓取的信 息用程序自动分类。
根据权利要求1所述的用户自动将本地计算机的信息发布到分类目录的步骤,用 户开放本地计算机的文件目录,可以将这些文件目录的链接发布到分类目录中,也可以将 这些文件目录中的内容复制带搜索引擎的分录目录中。
根据权利要求1所述的用户自动将本地计算机的信息发布到分类目录的步骤,用 户可以将桌面搜索的索引的链接发布到搜索引擎的分录目录中,用户可以通过NAT穿透技 术访问用户本地的文件。
根据权利要求1所述的用户采用语义P2P网络方式搜索加入领域的所有用户的信 息的步骤,用户通过程序向所有加入相关领域的用户发出请求,所有加入用户的计算机将 自己的相关领域的信息搜索出来并返回到请求计算机。
建立具有根节点的信息分类目录,可以是专门领域的组织或专家进行的分类;也 可以是用户自己根据喜好建立的分类;可以是学术的,也可以是通俗的分类。目录建立既有 高权限人员的集中建立;也有普通用户自己建立后,管理员进行审核的目录建立。有灵活的 增、删、改、查询等功能。
用户自动将本地计算机的信息发布到分类目录,用户设置自己本地计算机的开放 文件目录,分布式搜索引擎将这些文件目录的链接自动发布到分类目录中;如果还设置为 复制,这些文件目录中的内容将复制到搜索引擎的分录目录中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州域竹科技有限公司,未经杭州域竹科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510921658.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:游戏智能推荐方法及装置
- 下一篇:一种应用于能耗监控领域的数据混合存储方法