[发明专利]判断网页内容是否相同的方法无效
| 申请号: | 200810211667.0 | 申请日: | 2008-09-23 |
| 公开(公告)号: | CN101350032A | 公开(公告)日: | 2009-01-21 |
| 发明(设计)人: | 胡辉 | 申请(专利权)人: | 胡辉 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100012北京市朝*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 判断网页内容是否相同的方法,可用于搜索引擎技术领域,过滤网页内容相同的查询结果。根据计算网页标题的相似度和网页正文内容的相似度,根据网页的标题和正文内容的相似度来判断其是否为相同内容。如果二者的相似度达到一定阀值,那么就判定为相同内容的网页,否则就判定为不同内容的网页。 | ||
| 搜索关键词: | 判断 网页 内容 是否 相同 方法 | ||
【主权项】:
1.一种能够判断具有相同文章内容的网页的方法,其特征在于,包含:对于任意两个网页,(1)计算二者之间的网页标题相似度;(2)计算二者之间的网页正文相似度;(3)根据网页标题相似度和网页正文相似度,按照特定算法判断两个网页是否内容相同。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于胡辉,未经胡辉许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200810211667.0/,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法





