[发明专利]用于将数据记录分组的设备、系统以及方法在审

专利信息
申请号: 201480014861.3 申请日: 2014-03-14
公开(公告)号: CN105518658A 公开(公告)日: 2016-04-20
发明(设计)人: B·西马诺夫斯基;M·拉冈;L·保罗维兹 申请(专利权)人: 美国结构数据有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京市中咨律师事务所 11247 代理人: 杨晓光;于静
地址: 美国加利*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 数据 记录 分组 设备 系统 以及 方法
【权利要求书】:

1.一种设备,包括:

处理器,其被配置成运行存储在存储器中的一个或多个模块,其中所 述一个或多个模块被配置成:

识别针对其确定相似性值的至少一对数据记录;

至少部分地基于与所述至少一对数据记录相关联的多个属性, 确定所述至少一对数据记录的所述相似性值;以及

基于所述至少一对数据记录的所述相似性值,将所述至少一对 数据记录与一个或多个集群相关联,每个所述集群均与唯一实体相关 联。

2.根据权利要求1所述的设备,其中所述一个或多个模块进一步被配 置成基于可能由相关数据记录共享的一组预定属性,识别不需要针对其确 定相似性值的一对或多对数据记录。

3.根据权利要求2所述的设备,其中所述一个或多个模块被配置成基 于来自先前迭代的数据记录与集群的关联,调节所述一组预定属性。

4.根据权利要求1所述的设备,其中所述一个或多个模块被配置成基 于从训练数据记录得知的相似性函数,确定所述相似性值。

5.根据权利要求4所述的设备,其中所述相似性函数被设计成推断与 数据记录的特定属性相关联的特定组件的重要性,其中通过如下操作得知 所述相似性函数:

确定在与所述训练数据记录的所述特定属性相关联的组件之间的差 异,其中已知所述训练数据记录属于同一集群;以及

基于所述特定组件在所述差异中出现的次数,确定所述特定组件的重 要性。

6.根据权利要求4所述的设备,其中所述相似性函数被设计成推断将 数据记录的特定属性中的第一组件与第二组件互换的可能性,其中通过如 下操作得知所述相似性函数:

确定在与所述训练数据记录的所述特定属性相关联的组件之间的差 异,其中已知所述训练数据记录属于同一集群,以及

基于所述第一组件和所述第二组件同时在所述差异中出现的次数,确 定将所述第一组件与所述第二组件互换的可能性。

7.根据权利要求4所述的设备,其中所述相似性函数被设计成确定数 据记录的缺失属性具有特定组件的条件可能性,其中通过如下操作确定所 述条件可能性:

确定对应于特定实体的已知属性的组合;

确定缺失属性在具有所述已知属性的组合的特定实体的数据记录之 间的所有变化;以及

假定所述数据记录具有已知属性的特定组合,基于所述缺失属性的所 述变化来确定所述缺失属性具有特定组件的条件概率。

8.根据权利要求1所述的设备,其中所述一个或多个模块被配置成:

将多个数据记录表示为图中的多个节点;

将所述至少一对数据记录的所述相似性值表示为图中对应于所述至 少一对数据记录的节点之间的至少一个边;以及

基于所述图确定所述一个或多个集群。

9.根据权利要求8所述的设备,其中所述一个或多个模块被配置成基 于所述图,使用图聚类技术来确定所述一个或多个集群。

10.根据权利要求1所述的设备,其中所述一个或多个模块被配置成 接收要求所述一个或多个模块将两个数据记录与同一集群相关联的聚类 指令。

11.根据权利要求1所述的设备,其中所述一个或多个模块被配置成

使用聚类技术将所述多个数据记录中的至少一个关联到一个或多个 集群;以及

基于所述一个或多个集群中的数据记录,独立地调节针对所述一个或 多个集群中的每个集群的聚类技术的参数。

12.根据权利要求1所述的设备,其中所述一个或多个模块被配置成 通过从另一计算装置接收所述至少一对数据记录的所述相似性值,来确定 所述至少一对数据记录的所述相似性值。

13.根据权利要求1所述的设备,其中所述一个或多个模块被配置成:

从多个计算装置接收在所述多个计算装置处独立识别的多个子集群; 以及

在所述多个子集群上执行并查操作以识别所述一个或多个集群。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于美国结构数据有限公司,未经美国结构数据有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201480014861.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top