[发明专利]一种图片下载系统及方法有效
| 申请号: | 200710074405.X | 申请日: | 2007-05-10 |
| 公开(公告)号: | CN101071433A | 公开(公告)日: | 2007-11-14 |
| 发明(设计)人: | 胡景贺 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 深圳中一专利商标事务所 | 代理人: | 张全文 |
| 地址: | 518044广东省深圳市*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 图片下载 系统 方法 | ||
1.一种图片下载系统,其特征在于,所述系统包括:
网页分析模块,用于分析网页并获取所述网页中图片的统一资源定位符;
图片信息库,用于保存已下载图片的统一资源定位符,以及记录了图片与网站归属关系的文档信息;
控制模块,用于根据所述网页分析模块提供的统一资源定位符判断图片信息库中是否包括所述统一资源定位符,如果包括,向文档信息记录模块发出控制信号,如果不包括,向下载模块发送控制信号;
下载模块,用于在所述控制模块判定所述图片信息库中不包括所述统一资源定位符时,接收所述控制模块发送的控制信号,根据所述图片的统一资源定位符下载所述图片并将所述图片的统一资源定位符保存到图片信息库中;
文档信息记录模块,用于记录所述图片与网站的归属关系,并保存到所述图片信息库中;
所述控制模块进一步用于根据包括图片与网站归属关系的文档信息判断所述图片在当前网站出现次数是否大于阈值p,是则将其判定为广告图片并删除,否则不进行删除操作;其中阈值p为当前网站上已下载图片的平均分布值。
2.如权利要求1所述的图片下载系统,其特征在于,所述控制模块进一步用于判断当前图片的统一资源定位符在与当前网站相关的文档信息中的重复次数是否大于阈值p。
3.如权利要求1所述的图片下载系统,其特征在于,所述文档信息记录模块进一步用于根据所述下载模块下载的图片二进制源码计算所述图片的指纹,并将其保存到所述图片信息库中相应的文档信息中;
所述控制模块进一步用于判断当前图片的指纹在与当前网站相关的文档信息中重复出现的次数是否大于阈值p。
4.如权利要求1所述的图片下载系统,其特征在于,所述文档信息记录模块进一步用于记录图片与网页的位置关系;
所述图片信息库进一步用于保存记录了所述图片与网页的位置关系的文档信息。
5.如权利要求4所述的图片下载系统,其特征在于,所述图片在当前网站出现的次数通过图片在当前网站上的广告分值体现,所述广告分值按下式计算:
所述阈值p为所有图片在当前网站上的广告分值的平均数,所述所有图片在当前网站上的广告分值的平均数按下式计算:
6.如权利要求1至5任一权利要求所述的图片下载系统,其特征在于,所述系统进一步包括:
下载优化模块,用于对当前网页进行评价,根据评价对网页中的外部链接进行推送。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710074405.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种星光石的制备方法
- 下一篇:一种相关问题检索方法及系统





