[发明专利]基于关联关系的特征提取方法和装置有效
申请号: | 201811125901.8 | 申请日: | 2018-09-26 |
公开(公告)号: | CN109597851B | 公开(公告)日: | 2023-03-21 |
发明(设计)人: | 李龙飞 | 申请(专利权)人: | 创新先进技术有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/2458 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 开曼群岛大开曼岛*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 关联 关系 特征 提取 方法 装置 | ||
本说明书提供一种基于关联关系的特征提取方法,所述关联关系建立在N个主体之间,N为大于1的自然数;所述方法包括:根据主体之间的关联关系生成单个主体的N维基础向量;将某个主体的基础向量输入训练后的降维模型,以降维模型输出的向量作为所述主体的特征向量;所述降维模型是输入为N维向量、输出为M维向量的限制玻尔兹曼机模型,采用若干个所述主体的基础向量作为样本进行模型训练,M为小于N的自然数。
技术领域
本说明书涉及数据处理技术领域,尤其涉及一种基于关联关系的特征提取方法和装置。
背景技术
随着互联网的发展和普及,各种基于网络进行的活动都在源源不断的产生数据。数据挖掘技术能够从大量的数据中发现有价值的知识、模式、规则等信息,为科学研究、商业决策、过程控制等提供辅助支持,成为数据利用的重要方式。
在一些应用场景中,用于挖掘的数据记录能够体现相同或者不同类型的主体之间的关联关系。例如,可以通过转账记录在付款方与收款方之间建立关联关系;在账户登录记录中,账户与登录时所使用的设备之间具有关联关系。在针对关联关系进行数据挖掘时,从关联关系提取出的特征的维度、值域等会极大的影响数据挖掘的运算量。尤其对主体数量大、关联度高的应用场景中,降低计算压力、提高数据挖掘的速度对及时满足不断变化的业务要求具有重要的意义。
发明内容
有鉴于此,本说明书提供一种基于关联关系的特征提取方法,所述关联关系建立在N个主体之间,N为大于1的自然数;所述方法包括:
根据主体之间的关联关系生成单个主体的N维基础向量;
将某个主体的基础向量输入训练后的降维模型,以降维模型输出的向量作为所述主体的特征向量;所述降维模型是输入为N维向量、输出为M维向量的限制玻尔兹曼机模型,采用若干个所述主体的基础向量作为样本进行模型训练,M为小于N的自然数。
本说明书还提供了一种基于关联关系的特征提取装置,所述关联关系建立在N个主体之间,N为大于1的自然数;所述装置包括:
基础向量单元,用于根据主体之间的关联关系生成单个主体的N维基础向量;
降维输出单元,用于将某个主体的基础向量输入训练后的降维模型,以降维模型输出的向量作为所述主体的特征向量;所述降维模型是输入为N维向量、输出为M维向量的限制玻尔兹曼机模型,采用若干个所述主体的基础向量作为样本进行模型训练,M为小于N的自然数。
本说明书提供的一种计算机设备,包括:存储器和处理器;所述存储器上存储有可由处理器运行的计算机程序;所述处理器运行所述计算机程序时,执行上述基于关联关系的特征提取方法所述的步骤。
本说明书提供的一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器运行时,执行上述基于关联关系的特征提取方法所述的步骤。
由以上技术方案可见,本说明书的实施例中,采用以N维向量为输入、以M维向量为输出的限制玻尔兹曼机模型,将描述主体之间关联关系的N维基础向量降维为二值的M维向量,来作为主体的特征向量,极大的降低了在进行相似度比较和机器学习模型训练时的计算量,提高了运算效率,加快了数据挖掘的速度。
附图说明
图1是本说明书实施例中一种基于关联关系的特征提取方法的流程图;
图2是本说明书应用示例中一种基于资金往来关系的特征提取方法的流程示意图;
图3是运行本说明书实施例的设备的一种硬件结构图;
图4是本说明书实施例中一种基于关联关系的特征提取装置的逻辑结构图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811125901.8/2.html,转载请声明来源钻瓜专利网。