[发明专利]一种面向事件序列的因果建模方法及装置在审
| 申请号: | 202010829960.4 | 申请日: | 2020-08-18 |
| 公开(公告)号: | CN112069227A | 公开(公告)日: | 2020-12-11 |
| 发明(设计)人: | 巫英才;谢潇;何墨琪 | 申请(专利权)人: | 之江实验室 |
| 主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
| 代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 应孔月 |
| 地址: | 310023 浙江省杭州市余*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 事件 序列 因果 建模 方法 装置 | ||
本发明公开了一种面向事件序列的因果建模方法及装置,包括:获取多条事件序列数据,其中每条事件序列都包含多个带前后顺序关系的事件,事件序列中的事件都来源于一个共享的事件集合;将事件序列数据转化为向量化的表示,并完成事件序列的聚类;使用时间保留的检测方法获取聚类结果中每组事件序列所对应的因果网络,其中因果网络中每个节点是一个事件,节点之间通过有向边连接表示因果关系。本发明通过创建了一个新的因果检测框架实现了面向事件序列的因果检测方法,其实现方法简便,手段灵活,因果关系的质量能得到显著保证。
技术领域
本发明涉及计算机因果分析和可视化领域,尤其涉及一种面向事件序列的因果建模方法及装置。
背景技术
事件序列数据的因果分析可以表征事件之间的关系,在各个领域内都可以发挥重要作用,例如营销行为分析,电子病历和医疗保健分析,以及错误日志分析等等。控制实验是常见的推导事件原因的方法,但是由于实验设置的高昂成本,在许多情况下控制实验并不适用与应用领域。基于此,许多研究工作使用共现关系来模拟事件之间的联系。基于共现的方法假定频繁共同发生的事件高度相关。但是,共现不是因果关系,所提供的见解也比较模糊。因此,使用因果关系表征事件关系仍然是必不可少的。
现有的因果检测算法主要面向静态表格型数据,如基于约束的因果检测和基于评分的因果检测。尽管存在着与时间相关的因果检测方法,如格兰杰因果检测等等,这些方法面向的数据为连续的时间序列,无法直接应用于离散的事件序列。因此,目前缺少具体的实现方法来检测事件序列中包含的事件因果关系。
发明内容
本发明实施例的目的是提供一种面向事件序列的因果建模方法及装置,以解决现有因果检测方法无法直接应用于离散的事件序列的问题。
本发明的目的是通过以下技术方案来实现的:一种面向事件序列的因果建模方法,包括以下步骤:
第一方面,本发明实施例提供一种面向事件序列的因果建模方法,包括:
获取多条事件序列数据,其中每条事件序列S都包含多个带前后顺序关系的事件,事件序列中的事件都来源于一个共享的事件集合;
将事件序列数据转化为向量化的表示,并完成事件序列的聚类
使用时间保留的检测方法获取聚类结果中每组事件序列所对应的因果网络,其中因果网络中每个节点是一个事件,节点之间通过有向边连接表示因果关系。
第二方面,本发明实施例还提供一种面向事件序列的因果建模装置,包括:
获取模块,用于获取多条事件序列数据,其中每条事件序列S都包含多个带前后顺序关系的事件,事件序列中的事件都来源于一个共享的事件集合;
向量化和聚类模块,用于将事件序列数据转化为向量化的表示,并完成事件序列的聚类;
结果获取模块,用于使用时间保留的检测方法获取聚类结果中每组事件序列所对应的因果网络,其中因果网络中每个节点是一个事件,节点之间通过有向边连接表示因果关系。
第三方面,本发明实施例还提供一种面向事件序列的因果建模方法,包括:
根据目标城市A和周围城市集合C获取和A相关的空气污染事件序列S;
将空气污染事件序列S转化为向量化的表示,并完成事件序列的聚类;
使用时间保留的检测方法获取聚类结果中每组事件序列所对应的因果网络G,其中因果网络中每个节点是一个事件,节点之间通过有向边连接表示因果关系;
根据因果网络G分析城市A的空气污染传播来源,其中因果图中边的连接方向代表了空气污染的传播,空气污染的源头城市通过回溯边进而获取根节点得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010829960.4/2.html,转载请声明来源钻瓜专利网。





