[发明专利]一种关于集合类型决策效果的反事实预测方法在审
| 申请号: | 202010769250.7 | 申请日: | 2020-08-03 |
| 公开(公告)号: | CN112085252A | 公开(公告)日: | 2020-12-15 |
| 发明(设计)人: | 崔鹏;邹昊 | 申请(专利权)人: | 清华大学 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06F30/27;G06K9/62;G06F17/18 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 廖元秋 |
| 地址: | 100084*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 关于 集合 类型 决策 效果 事实 预测 方法 | ||
1.一种关于集合类型决策效果的反事实预测方法,其特征在于,包括以下步骤:
1)收集过去设定时间段内的观测数据样本,观测数据样本表示为{(xi,ti,yi)}1≤i≤n,其中,xi为第i个观测数据样本的混淆变量,ti为第i个观测数据样本的决策变量,yi为第i个观测数据样本的效果变量,n为观测数据样本总数;
所有样本的xi组成混淆变量X,所有样本的ti组成决策变量其中p为决策变量的维度,每一维为一个0-1变量,值为1代表该维度在对应的决策集合中,值为0代表该维度不在对应的决策集合中,所有样本的yi组成效果变量y;
2)构建一个变分自编码器学习决策变量的隐表征并进行训练,利用训练完毕的变分自编码器得到决策变量的隐表征;具体步骤如下:
2-1)构建一个变分自编码器,所述变分自编码器包括编码器qφ(z|T)和解码器两部分,其中z代表决策变量对应的隐表征;编码器和解码器的参数训练是通过最大化似然估计的下界得到,似然估计的下界为:
训练的方式采用了分批梯度下降的方式,p(z)是变分自编码器定义的隐表征的先验分布;编码器输出的隐表征的分布qφ(z|T)是一个隐空间上的各维独立的高斯分布,其中,μφ(T)为该高斯分布的中心,σφ(T)为各维的方差;
参数训练收敛后,得到训练完毕的编码器和解码器;
2-2)将每个观测数据样本的决策变量ti输入训练完毕的编码器qφ(z|T)得到该决策变量ti的隐表征的分布;最终,利用训练完毕的编码器得到观测数据样本对应的决策变量隐表征与混淆变量的联合分布中采样得到的数据点{(xi,z)}1≤i≤n,z~qφ(z|ti);决策变量隐表征与混淆变量无关联的联合分布中采样得到的数据点为{(xi,z)}1≤i≤n,z~p(z);
3)利用步骤2-2)得到的数据点计算在决策变量隐表征和混淆变量联合空间上的数据点的权重函数wz(x,z);具体步骤如下:
3-1)为观测数据样本对应的决策变量隐表征与混淆变量的联合分布采样得到的数据点{(xi,z)}1≤i≤n,z~qφ(z|ti)打上正例的标签L=1,为决策变量隐表征与混淆变量无关联的联合分布采样得到的每个数据点{(xi,z)}1≤i≤n,z~p(z)打上负例的标签L=0;
3-2)利用一个基于深度神经网络的二分类器对每个数据点及其对应标签进行训练,训练收敛后,将任一决策变量隐表征与混淆变量构成的数据点(x,z)输入该二分类器,该二分类器计算得到该数据点分别属于正例的概率和负例的概率其中,二分类器训练中最小化的目标函数为:
3-3)计算该数据点(x,z)的权重,表达式如下:
4)利用步骤3)的结果,计算每个观测数据样本对应的变分样本重加权VSR权重,其中第i个观测数据样本对应的VSR权重wi计算表达式如下:
其中,从第i个观测数据样本中的决策变量ti对应的隐表征分布qφ(z|ti)采样出m个点z1,z2,…,zm,则
5)为每个观测数据样本赋予步骤4)得到的VSR权重之后,得到对应的加权后的观测数据样本{wi(xi,ti,yi)}1≤i≤n;然后利用所有加权后的观测数据样本训练一个机器学习模型作为预测模型,得到训练完毕的预测模型;
其中,该预测模型为一个深度神经网络其最小化的目标函数为:
其中,为损失函数,是以θp为参数的机器学习模型;
6)利用步骤5)训练完毕的预测模型,对于一个混淆变量为X′、决策变量为T′的测试样本,将混淆变量X′与决策变量T′输入步骤5)训练完毕的预测模型,该模型输出即为对该测试样本效果的反事实预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010769250.7/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





