[发明专利]网页预读取方法及系统有效
| 申请号: | 201210265609.2 | 申请日: | 2012-07-27 |
| 公开(公告)号: | CN103577439B | 公开(公告)日: | 2017-02-08 |
| 发明(设计)人: | 胡又欢 | 申请(专利权)人: | 北京搜狗信息服务有限公司;北京搜狗科技发展有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京华沛德权律师事务所11302 | 代理人: | 马苗苗 |
| 地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 网页 读取 方法 系统 | ||
技术领域
本发明涉及浏览器技术领域,特别是涉及网页预读取方法及系统。
背景技术
用户经常使用浏览器来访问各种网站,但是网络访问速度受各种因素影响,可能用户客户端自身连接速度受限制,或是所访问的网站服务端带宽受限制,使得用户在访问网页时,需要等待一段时间,才能够将网页完全展现在用户面前。然而,用户总是希望获得更快的访问速度,不想把时间浪费在等待网页打开上。
为了提高网页访问速度,现有技术中出现了预读取技术,所谓的预读取是指,预先从后台对当前打开的网页中包含的链接指向的目标网页进行读取,并缓存在计算机本地,这样,当用户真正点击链接访问某对应的目标网页时,只需要从用户计算机本地的缓存中读取页面并进行相应的展现即可,从而达到提高访问速度的目的。
然而在实际应用中,对哪些网页进行预读取是需要考虑的问题。因为如果当前打开的网页中包含有大量的链接,如果对每条链接对应的目标网页都进行预读取,则需要耗费非常多的下载、存储等系统资源。然而,实际上用户可能并不是对当前打开的网页中包含的所有链接都进行点击访问,这就会造成以下结果:预读取了大量网页,而用户实际访问的可能只有其中的少数几个网页,其他未被用户访问但已经进行了预读取的网页,对其进行预读取时所耗费的系统资源而言是一种浪费。
因此,如何提高预读取的有效性,降低对系统资源的浪费,是迫切需要本领域技术人员解决的技术问题。
发明内容
本发明提供了网页预读取方法及系统,能够提高预读取的有效性,降低对系统资源的浪费。
本发明提供了如下方案:
一种网页预读取方法,包括:
记录用户在网页上的浏览行为信息;
根据所述浏览行为信息确定该用户已经浏览过其锚信息但未被该用户点击的链接;
当用户下次访问该网页时,将所述已经浏览过其锚信息但未被该用户点击的链接对应的目标网页排除在预读取的范围之外。
可选的,所述记录用户在网页上的浏览行为信息包括:
记录用户在网页上点击的链接;
所述根据所述浏览行为信息确定该用户已经浏览过其锚信息但未被该用户点击的链接包括:
根据所述用户在网页上点击的链接,确定该用户已经浏览过其锚信息但未被该用户点击的链接。
可选的,所述根据所述用户在网页上点击的链接,确定该用户已经浏览过其锚信息但未被该用户点击的链接包括:
获取网页中的各个链接在网页中的位置信息;
将与被点击链接相邻的前N1个链接以及后N2个链接,确定为用户已经浏览过其锚信息但未被该用户点击的链接,其中,N1与N2为预置的固定值。
可选的,所述记录用户在网页上的浏览行为信息还包括:
记录在网页上的停留时间和/或网页滚动信息;
所述根据所述用户在网页上点击的链接,确定该用户已经浏览过其锚信息但未被该用户点击的链接包括:
获取网页中的各个链接在网页中的位置信息;
将与被点击链接相邻的前N1个链接以及后N2个链接,确定为用户已经浏览过其锚信息但未被该用户点击的链接,其中,N1与N2的取值根据在网页上的停留时间和/或网页滚动信息确定。
可选的,在根据所述用户在网页上点击的链接,确定该用户已经浏览过其锚信息但未被该用户点击的链接之前,还包括:
判断在网页上点击的链接是否为网页的主要内容列表中的链接,如果是,则触发执行所述根据所述用户在网页上点击的链接,确定用户已经浏览过其锚信息但未被该用户点击的链接的步骤。
可选的,所述判断在网页上点击的链接是否为网页的主要内容列表中的链接包括:
根据被点击链接在网页的文档对象模型中的位置,查找被点击链接的父节点;
判断所述父节点下是否包含与所述被点击链接结构相似的子节点;
如果是,统计所述父节点下各个子节点对应的链接锚文本的平均长度值;
如果所述平均长度值大于预置的阈值,则确定在网页上点击的链接为网页的主要内容列表中的链接。
可选的,还包括:
获取网页所属的类别信息;
如果该网页属于预置的类别,则当用户下次访问该网页时,将所述用户在网页上点击的链接对应的目标网页排除在预读取的范围之外。
可选的,如果用户在网页中没有执行点击行为,则所述记录用户在网页上的浏览行为信息包括:
记录在网页上的停留时间和/或页面滚动信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗信息服务有限公司;北京搜狗科技发展有限公司,未经北京搜狗信息服务有限公司;北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210265609.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种快速丢弃垃圾装置
- 下一篇:包装结构





