[发明专利]用于副本的检测和抑制的方法无效
| 申请号: | 200510056187.8 | 申请日: | 2005-03-22 |
| 公开(公告)号: | CN1677393A | 公开(公告)日: | 2005-10-05 |
| 发明(设计)人: | M·S·马纳塞 | 申请(专利权)人: | 微软公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 上海专利商标事务所有限公司 | 代理人: | 沈昭坤 |
| 地址: | 美国华*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明提供一种方法,它通过对现有方法的这样一种更改:降低对每个对象存储器的要求而避免错误的检测却与现有方法几乎一样好,来在对象集合中检测相似对象。该更改包括(i)把特征的k个样本组合成s个超样本,k值从现有方法中使用的相应值减少而来;(ii)以b比特精确度记录每个超样本,b值从现有方法中使用的相应值减少而来;以及(iii)需要1个匹配超样本以便作出两个对象足够相似的结论,1值比现有方法中所需相应值大。本发明的一个应用与网络搜索引擎查询服务相关联以确定是相近副本文档的查询结果聚类。 | ||
| 搜索关键词: | 用于 副本 检测 抑制 方法 | ||
【主权项】:
1.一种用于在等效集合中检测相似对象的方法,其特征在于,包括,对于两个对象中的每一个:更改现有的用于检测相似对象的方法,使对存储器的需要减少并和所述现有方法几乎一样好地避免错误检测,其中所述更改包括:把一些特征样本组合成所有超样本中的每一个,其中所述样本的数量从所述现有方法使用的数量中减少而来;以一定比特精确度记录所述所有超样本的每一个,其中所述精确度比特数从所述现有方法中使用的精确度比特数中减少而来;以及需要总的超样本数量中的一些超样本数量匹配以便得出结论所述两个对象足够相似,其中所述匹配超样本的数量比所述现有方法中所需的匹配超样本数量更多。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200510056187.8/,转载请声明来源钻瓜专利网。





