[发明专利]一种基于结构化数据的预测系统在审
申请号: | 202110521408.3 | 申请日: | 2021-05-13 |
公开(公告)号: | CN113159450A | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 蔡少峰;郑凯平;陈刚;张美慧 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京云嘉湃富知识产权代理有限公司 11678 | 代理人: | 程凌军 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 结构 数据 预测 系统 | ||
1.一种基于结构化数据的预测系统,其特征在于,包括预处理模块和预测模块;预处理模块将所述结构化数据元组x的每个属性值转换为嵌入向量表示后输出给预测模块,预测模块使用多个指数神经元基于所述嵌入向量建模所述x的交叉特征,然后将所有所述交叉特征聚合构建所述x的特征向量,最后基于所述特征向量进行分类预测。
2.根据权利要求1所述的系统,其特征在于,所述将属性值转换为嵌入向量表示的过程如下:当所述属性值为数值型时,先根据该属性值域范围缩放到(0,1]区间内,再与预学习的嵌入向量相乘;当所述属性值为分类型时,直接根据其值索引对应预学习的嵌入向量。
3.根据权利要求1或2所述的系统,其特征在于,所述指数神经元的个数为K×o个,其中,K表示注意头的个数,o表示每个注意头的所述指数神经元的数目,K和o都是自然数;每个注意头的所有所述指数神经元共享其双线性注意函数的权重矩阵Watt;
每个注意头的第i个所述指数神经元yi表示如下:
其中,i,⊙表示哈达玛积,exp(·)函数和相应的指数wij按元素应用,ej表示所述结构化数据第j个属性值对应的嵌入向量,i,j,m,ne均为自然数,1≤i≤o,1≤j≤m,m表示所述结构化数据属性的个数,ne表示嵌入大小,表示yi对ej求导数,表示yi对wij求导数,diag(·)是对角矩阵函数;表示所述yi的动态特征交互权重,通过下式获得:
wi=zi⊙vi;
其中,表示可学习的注意权值向量,zi作为门,表示注意重校准权重,通过双线性注意对齐得分动态生成,表示如下:
其中,表示可学习的注意查询向量,T表示转置运算,表示双线性注意函数的权重矩阵,α-entmax(·)表示稀疏softmax,稀疏性随α的增大而增大,α为用于控制稀疏性的超参数,
4.根据权利要求3所述的系统,其特征在于,所述聚合为向量拼接。
5.根据权利要求4所述的系统,其特征在于,基于所述特征向量进行分类预测前先通过多层感知器MLP捕获元素的非线性特征交互,并获得编码关系的向量表示h:
其中,nh表示非线性特征交互尺寸,为自然数;
然后基于所述h进行分类预测。
6.根据权利要求5所述的系统,其特征在于,将所述系统与DNN结合进行目标预测。
7.根据权利要求3-6任一项所述的系统,其特征在于,所述系统还包括存储模块,对所述结构化数据提供底层存储支持,为所述预测模块的训练提供基于DBMS的逻辑表的抽象功能,以及在模型部署后,为具体应用的学习任务提供运行时数据收集、整理、转发至预测模块的功能;所述收集包括训练后的指数神经元参数配置、权重,以及当前预测实例及其权重,所述整理包括统计全局高频交互项、全局属性重要性排名、局部属性重要性排名。
8.根据权利要求7所述的系统,其特征在于,所述系统还包括功能模块,功能模块有预测单元、全局解释单元和局部解释单元组成,预测单元提供输入数据的预测结果输出,全局解释单元对所述具体应用的学习任务的整体逻辑,提供解释性支持,输出每一个属性的标量值,指示其全局重要性,以及所述全局高频交互项;局部解释单元针对单个待预测的样本,提供逐样本的局部性解释支持,输出对应于所述样本的每一个属性的标量值,指示其局部重要性,以及对应于所述样本的交互项。
9.根据权利要求8所述的系统,其特征在于,所述系统还包括应用模块,提供对结构化数据应用的端到端的支持,对系统其它模块的接口提供调度和封装。
10.一种电子设备,其特征在于,所述电子设备包括至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述的一种基于结构化数据的预测系统。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110521408.3/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置