[发明专利]一种基于关联关系的双粒度噪声日志过滤方法有效
| 申请号: | 201910218832.3 | 申请日: | 2019-03-21 |
| 公开(公告)号: | CN110032494B | 公开(公告)日: | 2020-05-26 |
| 发明(设计)人: | 孙笑笑;侯文杰;俞东进;潘建梁 | 申请(专利权)人: | 杭州电子科技大学 |
| 主分类号: | G06F11/30 | 分类号: | G06F11/30 |
| 代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
| 地址: | 310018 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 关联 关系 粒度 噪声 日志 过滤 方法 | ||
本发明公开了一种基于关联关系的双粒度噪声日志过滤方法。该方法基于局部依赖度和全局依赖度计算得到混合依赖度,通过本发明方法能够同时实现日志中噪声事件的细粒度过滤和噪声轨迹的粗粒度过滤。相比于传统的日志过滤方法,本发明具有如下收益:1、采用了双粒度过滤机制,对于不同的噪声情景使用不同的过滤机制,从而在尽可能保留原始日志数据的情况下实现了优秀的过滤效果;2、使用过滤后的日志文件用于流程挖掘能极大提高流程发现模型的精度,增强了模型的可理解性。
技术领域
本发明涉及流程挖掘领域,尤其涉及一种基于关联关系的双粒度噪声日志过滤方法。
背景技术
流程挖掘旨在从过程感知信息系统记录的事件日志中提取有用的信息来帮助利益相关者了解流程的实际执行情况。流程发现作为流程挖掘的重要部分,其作用在于构建可以重现事件日志记录行为的流程模型。高精度模型可以直观地展现出业务流程的实际执行情况。
在业务流程管理系统中,业务流程的活动是依照精心设计的流程模型执行的,这些活动的执行将被记录在日志中,来帮助利益相关者分析和监控流程的执行。在现实生活中,大多数业务流程的都没有标准化的流程模型,或者是随着业务流程的不断演进流程模型与当前的业务流程存在较大的差异,因此人们需要依靠流程发现技术从流程产生的日志中提取流程的实际执行行为。但是,日志中存在的噪声会对流程发现模型的质量产生负面影响。如果使用流程发现技术对包含噪声的日志进行流程发现会导致其发现模型产生不可见任务和非自由选择结构,从而增加了挖掘模型的复杂性与可理解性。常见的日志噪声有如下几类:缺失型噪声事件(流程中的某些事件由于某些原因未被记录在日志中),冗余型噪声事件(流程中某些事件被多次重复记录),错位型噪声事件(某些事件在流程轨迹中发生的顺序位置被记录错误)。
噪声过滤算法可以有效的过滤掉日志中的噪声事件,大大提高流程发现模型的精度。目前的日志噪声过滤算法根据其过滤粒度可大致分为两类,粗粒度过滤和细粒度过滤。其中粗粒度过滤将包含噪声事件的轨迹直接移除原始日志,但是对于规模较小的日志数据来说移除整条轨迹可能会对挖掘的模型结构产生较大的改变。细粒度过滤则只将噪声事件移除,保留该轨迹上的其他事件,但是在移除噪声事件的同时不能保证该行为不会为轨迹带来新的噪声,同时该类算法也无法解决缺失型噪声事件产生的问题。
发明内容
为了克服上述现有技术的不足,本发明提供一种基于关联关系的双粒度噪声日志过滤方法,可有效解决上述问题。本发明具体采用的技术方案如下:
一种基于关联关系的双粒度噪声日志过滤方法,包括以下步骤:
(1)输入原始日志文件,对其进行数据预处理后生成由多条流程轨迹σ组成的一个日志集合每条流程轨迹由多个流程事件ei组成σ=e1,…,en,记所有流程轨迹中所有流程事件e的集合为ε,即e∈ε;
(2)统计日志集合中所有流程轨迹中两两流程事件之间的频次依赖度DFD(ei,ej);
(3)进一步计算出两两事件之间的局部依赖度Deplocal(ei,ej),全局依赖度Depglobal(ei,ej)以及混合依赖度Depmixed(ei,ej);
所述局部依赖度Deplocal(ei,ej)计算公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910218832.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:页面的监控方法、装置、终端及可读存储介质
- 下一篇:数据异常检测方法和装置





