[发明专利]模拟专家评分的工作流相似度评价方法及系统在审
申请号: | 202210867730.6 | 申请日: | 2022-07-22 |
公开(公告)号: | CN115204700A | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 曹健;顾扬;钱诗友 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06K9/62 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 胡晶 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模拟 专家 评分 工作流 相似 评价 方法 系统 | ||
本发明提供了一种模拟专家评分的工作流相似度评价方法及系统,包括如下步骤:评价指标获取步骤:通过模拟专家评分获得工作流综合结构相似度评价指标;相似度评价步骤:根据工作流综合结构相似度评价指标评价工作流之间的相似度。本发明模拟专家评分的数据,生成了一套工作流相似度的评价标准,可以自动为工作流相似度添加标签,便于生成大量数据用于下游任务,减少了人工标注所消耗的人力物力。
技术领域
本发明涉及数据挖掘与分析的技术领域,具体地,涉及一种模拟专家评分的工作流相似度评价方法及系统。
背景技术
随着当今业务流程和科学研究越来越复杂,自动化的工作流技术扮演了越来越重要的角色。工作流(Workflow)是对工作流程及其各操作步骤之间关系规则的概括描述,主要分为业务工作流和科学工作流。它定义了许多流程处理和分析的任务单元,并通过数据流进行连接和驱动,通常可表示为有向图(Directed Graph)。
工作人员可以在数据库中搜索满足自身需求的工作流进行重用或修改,而不需要从头设计,因此节省了大量的时间专注于业务或科学问题本身。与此相关的技术主要有:工作流聚类、工作流检索、工作流推荐等,而这些技术的核心问题都是工作流相似性的度量。现有的方法主要分为基于文本的和基于结构的相似度计算:基于文本的方法主要利用工作流的标题、描述等进行文本相似度计算但没有考虑工作流的结构语义,而基于结构的方法则根据不同粒度的工作流拓扑单元之间的对应关系计算相似度,包括模块、工作流的子结构和整个图结构。但是,目前的方法对工作流的结构特征提取各有侧重,亟需设计一种综合考量工作流结构语义的相似度计算方法。为了评价各种相似度方法的效果,我们可以邀请领域专家对工作流相似度进行评分。
公开号为CN106991006A的中国发明专利文献公开了一种支持依赖和时间平衡的云工作流任务聚类方法,在对流程图中同一层级的任务进行聚类时优先考虑了任务之间的数据依赖关系,并考虑了聚类之间的时间平衡,在对同一层级的任务进行聚类时并不是简单地将具有相同子任务的父任务聚集在一起,而是综合考虑了这些任务共有的子任务以及它们各自特有的子任务,在此基础上提出了任务关联度的概念和计算公式来表征任务之间的依赖程度。
针对上述中的相关技术,发明人认为邀请领域专家对工作流相似度进行评分虽然可信度较高但收集过程耗时耗力且数据量较少,另外专家往往按照粗粒度的等级来评分,不能满足精度要求较高的评价需求。因此,如果能够模拟专家打分的数据,生成一套工作流相似度的自动评价准则,精确计算出任意两个工作流间的相似度,将兼具合理性、普适性和实际应用价值。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种模拟专家评分的工作流相似度评价方法及系统。
根据本发明提供的一种模拟专家评分的工作流相似度评价方法,包括如下步骤:
评价指标获取步骤:通过模拟专家评分获得工作流综合结构相似度评价指标;
相似度评价步骤:根据工作流综合结构相似度评价指标评价工作流之间的相似度。
优选的,所述评价指标获取步骤包括如下步骤:
数据集构建步骤:获取专家评分数据集,专家评分数据集包括若干个工作流查询模型和工作流比较模型;
比较对构建步骤:对于每个工作流查询模型,从工作流查询模型对应的工作流比较模型中任意抽取构成比较对(x1,x2);其中,x1表示第一工作流比较模型,x2表示第二工作流比较模型;
结构相似度计算步骤:分别计算每一个比较对里的工作流比较模型与工作流查询模型的结构相似度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210867730.6/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理