[发明专利]检测复制和近似复制的文件有效
| 申请号: | 200780036634.0 | 申请日: | 2007-08-03 |
| 公开(公告)号: | CN101523343A | 公开(公告)日: | 2009-09-02 |
| 发明(设计)人: | 莫尼卡·H·亨津格尔 | 申请(专利权)人: | 谷歌公司 |
| 主分类号: | G06F7/02 | 分类号: | G06F7/02 |
| 代理公司: | 中原信达知识产权代理有限责任公司 | 代理人: | 张焕生;安 翔 |
| 地址: | 美国加利*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 可以通过以下方式来识别近似复制的文档:使用第一技术来处理已接受的文档集合以确定近似复制的文档的第一集合,以及使用第二技术来处理所述第一集合以确定近似复制的文档的第二集合。第一技术可以依赖于标志次序,而第二技术可以独立于次序。第一技术可以独立于标志频率,而第二技术可以依赖于频率。第一技术可以使用基于两个文档的词语或标志的子集的表示来确定这两个文档是否是近似复制件,而第二技术可以使用基于两个文档的所有词语或标志的表示来确定这两个文档是否是近似复制件。第一技术可以使用集合相交来确定文档是否是近似复制件,而第二技术可以使用随机投射来确定文档是否是近似复制件。 | ||
| 搜索关键词: | 检测 复制 近似 文件 | ||
【主权项】:
1. 一种用于识别近似复制的文档的计算机实现的方法,所述方法包括:a)接受文档的集合;b)使用第一文档相似性技术处理所述文档的集合以确定近似复制的文档的第一集合;以及c)使用第二文档相似性技术处理近似复制的文档的所述第一集合以确定近似复制的文档的第二集合。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌公司,未经谷歌公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200780036634.0/,转载请声明来源钻瓜专利网。
- 上一篇:用于存储和访问数据的方法
- 下一篇:使用原位图像修改层的高分辨率成像工艺





