[发明专利]用于数据处理的方法、装置和介质在审
申请号: | 201910335036.8 | 申请日: | 2019-04-24 |
公开(公告)号: | CN111861519A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 冯璐;崔绿叶;卫文娟;刘春辰 | 申请(专利权)人: | 日本电气株式会社 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06N20/00 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 数据处理 方法 装置 介质 | ||
1.一种用于数据处理的方法,包括:
获取关于多个因素的观测样本集合,所述观测样本集合中的一个观测样本包括所述多个因素的相应观测值;
针对所述多个因素中的每个因素,基于所述观测样本集合来估计所述因素的观测值与所述因素的估计值之间的差所服从的分布,所述估计值基于所述多个因素中的至少一个其他因素的观测值和所述至少一个其他因素对所述因素的影响来确定;以及
至少基于估计的所述分布来确定表示所述多个因素间的因果关系的因果结构。
2.根据权利要求1所述的方法,其中所述多个因素包括目标因素,并且所述方法还包括:
基于确定的所述因果结构,从所述多个因素中确定作为所述目标因素的原因的至少一个因素;以及
通过改变所述至少一个因素的观测值来影响所述目标因素的观测值。
3.根据权利要求2所述的方法,还包括:
获取关于所述多个因素的经改变的观测样本集合,所述经改变的观测样本集合中的至少一个观测样本包括所述至少一个因素的经改变的观测值;以及
基于所述经改变的观测样本集合,优化所述因果结构。
4.根据权利要求1所述的方法,其中估计所述分布包括:
估计所述至少一个其他因素对所述因素的所述影响;以及
基于所述影响、所述观测样本集合中的所述因素的观测值和所述至少一个其他因素的观测值来估计所述分布。
5.根据权利要求4所述的方法,其中估计所述影响包括:
使用B样条回归算法来估计所述影响。
6.根据权利要求4所述的方法,其中估计所述分布包括:
使用核密度估计算法来估计所述分布。
7.根据权利要求1所述的方法,其中所述分布不同于高斯分布。
8.根据权利要求1所述的方法,其中确定所述因果结构包括:
基于所述分布,生成用于确定所述因果结构的目标函数,所述目标函数不包括惩罚项;以及
通过使所述目标函数最小化来确定所述因果结构。
9.根据权利要求1所述的方法,其中所述因果结构利用有向无环图来表示,所述有向无环图包括与所述多个因素相对应的多个节点,并且确定所述因果结构包括:
基于所述分布,确定与所述多个因素中的多个因素对相关联的多个因果关系得分,其中所述多个因素对中的第一因素对的因果关系得分指示所述第一因素对中的一个因素是另一因素的原因的似然度;以及
迭代地执行以下操作,直到迭代次数达到阈值数目:
通过比较所述多个因果关系得分来确定所述多个因素对中与最大似然度相关联的第二因素对,所述第二因素对指示所述第二因素对中的第一因素是所述第二因素对中的第二因素的原因;
向所述有向无环图添加从对应于所述第一因素的第一节点指向对应于所述第二因素的第二节点的边缘;以及
更新所述多个因果关系得分中与所述第二因素相关联的一个或多个因果关系得分。
10.根据权利要求9所述的方法,其中所述阈值数目基于所述多个因素对的数目来确定。
11.根据权利要求9所述的方法,还包括:
从所述多个因素中确定可能存在因果关系的两个因素,以作为所述多个因素对之一。
12.根据权利要求9所述的方法,还包括:
使用稀疏回归算法对所述有向无环图中的边缘进行优化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于日本电气株式会社,未经日本电气株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910335036.8/1.html,转载请声明来源钻瓜专利网。