[发明专利]一种实现云搜索服务的方法及系统有效
| 申请号: | 201110144818.7 | 申请日: | 2011-05-31 |
| 公开(公告)号: | CN102164186A | 公开(公告)日: | 2011-08-24 |
| 发明(设计)人: | 潘海东;梅春;刘刚 | 申请(专利权)人: | 互动在线(北京)科技有限公司 |
| 主分类号: | H04L29/08 | 分类号: | H04L29/08;G06F17/30 |
| 代理公司: | 北京正理专利代理有限公司 11257 | 代理人: | 张雪梅 |
| 地址: | 100086 北京市海淀区知*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 实现 搜索 服务 方法 系统 | ||
技术领域
本发明涉及信息检索领域,具体涉及一种实现云搜索服务的方法及系统,即实现云服务端为站点提供搜索服务的方法和系统。
背景技术
随着互联网技术的发展,搜索已经成为网站必不可少的功能。在个人建站系统中,常用的站内搜索技术主要有三种。
1、基于数据库的搜索
通过数据库sql语句的单字索引功能完成最简单的索引功能和最低级的全文检索,且只能进行标题的检索,处于检索时,数据库消耗大量硬件资源,无法开展各种附加功能,效率非常低下。
2、基于spider抓取的站内搜索
通过spider抓取网页,经html解析,分词,索引实现网页式站内搜索,
这样做的的缺点是:有大量的不必要的信息影响搜索结果的排序和显示效果,严重影响搜索精确度,并且用户对搜索范围和内容以及呈现的结果无法精确控制。
3、基于搜索引擎的站内搜索
很多站点使用大型搜索引擎如Google的站内检索site.domain.com代替了自己的站内数据库全文检索,但依靠Google这样的大型搜索引擎并不会深度遍历一个网站,也不会将该网站的所有内容都收录并索引,而是只收录最新更新的静态网页,且缺少入口的网站内容将逐渐被抛弃,此外,搜索引擎针对站点的更新频率也是有一定周期的,很多内容需要一定时间后才能收录。
另外,搜索引擎技术门槛较高,需要高性能的服务器和技术人员支持,对普通的个人站点来说不适合。
因此,需要为站点提供一种针对站点内容、实时动态更新、分站点索引以及高效地提供搜索服务的方法。
发明内容
本发明的目的在于,通过云服务端为站点提供站点资源搜索的服务,使得站点无需考虑资源索引存储以及其他搜索技术细节。
本发明的又一目的在于,当用户在站点进行搜索时,该站点不仅能够将本站点的相关内容呈现给用户,必要时还能够将注册入云服务端的所有联盟站点的相关内容也呈现给用户。
根据本发明,提供一种云搜索服务注册方法,该方法包括以下步骤:
站点发送注册申请至云服务端,所述注册申请至少包括站点域名;
所述云服务端根据所述注册申请为所述站点分配站点ID,并根据所述站点ID建立所述站点的资源索引的目录;
所述云服务端采集所述站点的资源并存储,根据所述站点资源生成站点资源索引;
所述云服务端根据所述站点资源索引的目录定义的位置存储所述站点资源索引。
优选地,所述方法还包括,云服务端将所述站点的注册申请、站点ID以及站点资源索引的目录以一一对应的方式存储。
优选地,所述注册申请还包括站点名称和/或站点状态。
优选地,所述云服务端在其存储的所有站点的资源的基础上生成总资源索引。
优选地,所述目录采用多级目录的方式建立。
优选地,所述云服务端采集所述站点的资源并存储包括:
所述云服务端通过所述站点提供的资源标准化内容接口采集所述站点的资源,所述站点资源包括标准化内容,所述标准化内容包括资源访问地址、资源ID、资源名称、资源分类、资源正文和资源最后修改时间;
所述云服务端存储所述资源的标准化内容。
优选地,所述资源的标准化内容还包括资源标签、资源摘要、资源作者ID、资源作者、资源创建时间、资源浏览量、资源编辑次数、资源版本数和资源评论数中的至少一个。
优选地,所述站点提供的资源标准化内容接口采用XML语言编写,并对每个资源有独立的资源访问地址。
优选地,所述资源为词条、文章、图片和视频中的至少一种。
根据本发明,提供一种云搜索服务系统中的云服务端的站点资源索引更新方法,所述云搜索服务系统包括云服务端和多个站点,所述云服务端存储有每个站点的站点域名、站点资源索引的目录、站点资源索引以及站点资源,该方法包括以下步骤:
站点响应用户对站点资源所做的编辑,发送更新消息至云服务端,所述更新消息包括站点域名、资源访问地址、资源类型和编辑模式;
所述云服务端调用所述资源访问地址,以获取所述站点资源;
所述云服务端根据所述站点域名和资源类型得到其存储的所述站点的该类型的资源和资源索引的目录,进而获取其存储的所述站点的该类型的资源索引;
所述云服务端利用其获取的站点资源,根据所述编辑模式更新其存储的所述站点的该类型的资源,并根据更新后的站点资源更新其存储的站点资源索引。
优选地,所述资源类型为词条类型、文章类型、图片类型和视频类型中的一种;所述编辑模式为创建、修改、删除和恢复中的一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于互动在线(北京)科技有限公司,未经互动在线(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110144818.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:造纸凝结水回收系统
- 下一篇:多色彩多透镜光源矩阵的LED手术无影灯





