[发明专利]使用字段级删除邻域的改进的模糊搜索在审

专利信息
申请号: 202110550209.5 申请日: 2021-05-20
公开(公告)号: CN113821544A 公开(公告)日: 2021-12-21
发明(设计)人: 丹尼尔·斯科特·坎珀 申请(专利权)人: 律商联讯风险解决方案公司
主分类号: G06F16/2458 分类号: G06F16/2458;G06F16/903;G06F16/22;G06F16/25;G06F16/23
代理公司: 北京高沃律师事务所 11569 代理人: 韩雪梅
地址: 美国佐治亚州阿*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 使用 字段 删除 邻域 改进 模糊 搜索
【权利要求书】:

1.一种在包含多个实体表示记录的数据库中标识记录并对记录进行去重的方法,每个实体表示记录包括唯一的记录标识符和多个字段,每个字段能够包含字段值,所述方法包括:

对于所述多个实体表示记录中的每个记录,确定所述记录的两个或更多个字段组合的字段级删除邻域,包括:

确定字段哈希值;

创建字段排列;

确定每个排列的组合记录哈希值;

将每个记录哈希值与所述唯一的实体标识符相关联;

对于每个实体表示记录:

搜索其他实体表示记录以查找匹配组合记录哈希值;以及

将唯一的实体标识符和重复实体标识符中的一个或多个分配给具有所述匹配组合记录哈希值的其他实体表示记录。

2.根据权利要求1所述的方法,其进一步包括,从所述数据库中移除具有所述重复实体标识符的其他实体表示记录中的至少一个。

3.根据权利要求2所述的方法,其进一步包括,将所移除的实体表示记录的至少一个唯一字段值保存在至少由所述唯一的实体标识符标识的数据保留字段中。

4.根据权利要求1所述的方法,其进一步包括,移除所述数据库中具有相同指定的唯一的实体标识符的记录中除一个代表性实体表示记录外的所有记录。

5.根据权利要求4所述的方法,其中,所述代表性实体表示记录包括具有最高准确性置信度的记录。

6.根据权利要求1所述的方法,其中,所述记录的两个或更多个字段组合包括以下项中的一个或多个:预定字段、必填字段、组合字段和有序字段。

7.根据权利要求1所述的方法,其中,创建所述字段排列包括省略每个排列的至少一个字段。

8.根据权利要求1所述的方法,其进一步包括,对于每个字段值确定字段字符串级删除邻域。

9.根据权利要求8所述的方法,其中,确定所述字段字符串级删除邻域包括确定一个或多个字段字符串片段。

10.一种去重系统,包括:

包含多个实体表示记录的数据库,每个实体表示记录包括唯一的实体标识符和多个字段,每个字段能够包含字段值;

一个或多个处理器;以及

与所述一个或多个处理器通信的存储器,所述存储器存储指令,当所述指令由所述一个或多个处理器执行时,导致所述系统执行以下操作:

对于所述多个实体表示记录中的每个记录,确定所述记录的两个或更多个字段组合的字段级删除邻域,所述字段级删除邻域通过以下方式确定:

计算字段哈希值;

创建字段排列;

计算每个排列的组合记录哈希值;

将每个记录哈希值与所述唯一的实体标识符相关联;

对于每个实体表示记录:

搜索其他实体表示记录以查找匹配组合记录哈希值;以及

将重复实体标识符分配给具有所述匹配组合记录哈希值的其他实体表示记录。

11.根据权利要求10所述的去重系统,其中,所述指令进一步导致所述系统从所述数据库中移除具有重复实体标识符的其他实体表示记录中的至少一个。

12.根据权利要求11所述的去重系统,其中,所述指令进一步导致所述系统将所移除的实体表示记录的至少一个唯一字段值保存在至少由所述唯一的实体标识符标识的数据保留字段中。

13.根据权利要求10所述的去重系统,其中,所述指令进一步导致所述系统将所述唯一的实体标识符分配给具有所述匹配组合记录哈希值的其他实体表示记录。

14.根据权利要求10所述的去重系统,其中,所述记录的两个或更多个字段组合包括以下项中的一个或多个:预定字段、必填字段、组合字段和有序字段。

15.一种用于使用不完全搜索条件从数据库中查找记录的方法,所述数据库包含多个实体表示记录,每个实体表示记录包括唯一的实体标识符和多个字段,每个字段能够包含字段值,所述方法包括:

对于所述多个实体表示记录中的每个记录,确定所述记录的两个或更多个字段组合的字段级删除邻域,所述确定所述字段级删除邻域包括:

确定字段哈希值;

创建字段排列;

确定每个排列的组合记录哈希值;

将每个记录哈希值与所述唯一的实体标识符相关联;

对于每个实体表示记录:

搜索其他实体表示记录以查找匹配组合记录哈希值;以及

将所述唯一的实体标识符分配给具有所述匹配组合记录哈希值的其他实体表示记录。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于律商联讯风险解决方案公司,未经律商联讯风险解决方案公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110550209.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top