[发明专利]一种关于集合类型决策效果的反事实预测方法在审
| 申请号: | 202010769250.7 | 申请日: | 2020-08-03 |
| 公开(公告)号: | CN112085252A | 公开(公告)日: | 2020-12-15 |
| 发明(设计)人: | 崔鹏;邹昊 | 申请(专利权)人: | 清华大学 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06F30/27;G06K9/62;G06F17/18 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 廖元秋 |
| 地址: | 100084*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 关于 集合 类型 决策 效果 事实 预测 方法 | ||
本发明提出一种关于集合类型决策效果的反事实预测方法,属于机器学习技术领域。本发明将决策变量与混淆变量去相关问题转化为更低维度的决策变量隐表征和混淆变量去相关问题,采用基于深度神经网络的概率密度比估计方法,将观测数据样本对应的决策变量隐表征和混淆变量的联合分布与决策变量隐表征和混淆变量无关联的联合分布的概率密度比作为决策变量隐表征和混淆变量构成的数据点的权重。采用变分样本重加权方法把决策变量隐表征和混淆变量构成的数据点的权重综合为观测数据中样本的权重,利用加权后的观测数据样本训练反事实预测模型可对个体在特定决策影响下的效果进行反事实预测。本发明提高了反事实预测的准确度,有很高的应用价值。
技术领域
本发明属于机器学习技术领域,特别提出一种关于集合类型决策效果的反事实预测方法。
背景技术
利用大量的观测数据,对异质性个体被施以不同决策后所产生的效果进行反事实预测是一个在许多领域都有重要意义的问题。通过预测不同决策所产生的效果,可以帮助相关领域的技术人员做更准确的决策,例如在工业生产领域中对某一种产品选择一系列加工工序,使得产品的品质达到最理想的情况。
为了预测不同决策所产生的效果,随机对照试验是解决此类反事实预测问题的标准方法,即对研究对象随机地分配决策,并观察其效果。如在工业生产中,尝试利用不同的加工工序,并测试加工后产品的品质(强度、纯度等指标),从而指导选择最优的一系列工序。但是随机对照试验往往代价很高,会消耗大量时间和成本。而现如今大量的观测数据的积累,例如过去的时间里人们根据经验对产品选择工序加工,并测量品质的记录。这些观测数据给出了一种替代方法,就是利用机器学习技术从中学习得到一个对不同决策的效果进行反事实预测的模型。监督学习的方法可以被直接利用于对模型的训练,但是由于在观测数据中,决策的选择往往受到混淆变量的影响。直接使用监督学习的技术,学习从决策到效果的模型可能会错误地把混淆变量对效果的影响归为决策变量的影响。例如观测数据中某类产品原材料的质量条件(混淆变量)不佳,因此采用了一些的加工工序(决策变量)来处理之后,产品品质(结果变量)依然低下,这可能会使预测模型误以为是加工工序引起的低品质。因此为了能准确地评估不同决策变量影响下的效果,需要对观测数据进行去混淆偏差处理,即去除混淆变量与决策变量之间的相关性。在此去除混淆偏差的数据上训练得到的机器学习模型,能够更准确地对不同决策对个体影响的效果进行反事实预测。在工业生产中可以更准确地估计出不同加工工序下的品质,从而选择最优的加工工序。
现有的对不同决策产生的效果的反事实预测技术为了对观测数据进行去混淆偏差处理,采用了以重要度采样权重对样本进行加权的方法,使得加权后的数据中决策变量和混淆变量相关性降低。这类技术的不足之处在于其只解决决策变量为单变量下的反事实预测,应用范围过窄。而实际中很多决策是基于高维度的向量进行的,例如选择的加工方案是若干道工序的集合,如果用现有的对单变量决策的效果的反事实预测方法处理这类问题,可以用二进制编码的方式把高维向量转化为一个单变量的整数。但是这样的做法,会引起复杂度过高的问题。
发明内容
本发明的目的是为克服已有技术的不足之处,提出一种关于集合类型决策效果的反事实预测方法。利用本发明方法训练得到的反事实预测模型,相比于普通的监督学习得到的反事实预测模型,对各个对象个体在施加不同决策下的效果的反事实预测误差会有明显的降低,提高了反事实预测的准确度,有很高的应用价值。
本发明提出一种关于集合类型决策效果的反事实预测方法,其特征在于,包括以下步骤:
1)收集过去设定时间段内的观测数据样本,观测数据样本表示为{(xi,ti,yi)}1≤i≤n,其中,xi为第i个观测数据样本的混淆变量,ti为第i个观测数据样本的决策变量,yi为第i个观测数据样本的效果变量,n为观测数据样本总数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010769250.7/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





