[发明专利]任务操作指令映射模型训练数据生成方法、系统、设备及存储介质在审

专利信息
申请号: 202111072833.5 申请日: 2021-09-14
公开(公告)号: CN113886351A 公开(公告)日: 2022-01-04
发明(设计)人: 唐琦松;林平;吴鑫;靳志业 申请(专利权)人: 上海艺赛旗软件股份有限公司
主分类号: G06F16/18 分类号: G06F16/18;G06F16/2458;G06F9/48
代理公司: 南京纵横知识产权代理有限公司 32224 代理人: 董建林
地址: 201100 上海市闵行区申*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 任务 操作 指令 映射 模型 训练 数据 生成 方法 系统 设备 存储 介质
【说明书】:

发明公开了任务操作指令映射模型训练数据生成方法、系统、设备及存储介质,所述生成方法包括获取基于实际任务编写的若干任务描述脚本,将所述若干任务描述脚本随机组合成若干任务描述脚本组;执行所述任务描述脚本组,获取所述任务描述脚本组所对应的任务执行时间戳数据、执行过程中的事件日志数据和屏幕录屏数据;将一组任务描述脚本组、事件日志数据和屏幕录屏数据作为训练样本,构建训练数据集。本发明提供了一种半自动化生成操作指令训练数据的生成方法,只需要少量任务描述脚本中就可以生成大量、多种模态的训练数据,极大地减少训练模型的成本。

技术领域

本发明涉及任务操作指令映射模型训练数据生成方法、系统、设备及存储介质,属于模型训练技术领域。

背景技术

在IT系统中存在大量的日志,它们记录了在实际场景中业务流程执行的过程;要从日志中还原出实际的业务流程,一般采用成熟的流程挖掘算法,而流程挖掘算法需要使用规范的日志,才能够表示出业务流程的真实情况,方便用户对业务流程做统计、分析,以及流程优化,提高业务流程的效率;实际的日志数据往往是混乱的,充满了各种错误和噪音,直接使用这样的日志,构建的业务流程图也会充满错误,使得后续的处理也变得不可靠。

要处理日志中噪音和错误,一般采用基于规则的方式和基于机器学习的方式;基于规则的方式需要编写大量包含业务逻辑的代码,工作量大而且不够灵活,不能随着业务的发展变化而变化;基于机器学习的方式,工作量相对较小,但是需要大量的标注数据;由于日常工作中计算机操作的范围很大,且数据量也很大,无论是采集数据,还是标注数据都是成本巨大,难以执行。

发明内容

本发明的目的在于克服现有技术中的不足,提供任务操作指令映射模型训练数据生成方法、系统、设备及存储介质。

第一方面,本发明提供了一种任务操作指令映射模型训练数据生成方法,包括:

获取基于实际任务编写的若干任务描述脚本,将所述若干任务描述脚本随机组合成若干任务描述脚本组;

执行所述任务描述脚本组,获取所述任务描述脚本组所对应的任务执行时间戳数据、执行过程中的事件日志数据和屏幕录屏数据;

将一组任务描述脚本组、事件日志数据和屏幕录屏数据作为训练样本,构建训练数据集。

进一步的,所述任务描述脚本组包含多个任务描述脚本,所述多个任务描述脚本随机混合执行获得混合了多个任务的操作指令序列。

进一步的,所述任务描述脚本包括有明确目标的任务脚本和通用随机任务脚本。

进一步的,所述任务执行时间戳数据包括所述操作指令序列中每条操作指令的开始和结束时间。

进一步的,所述操作指令序列、事件日志数据和屏幕录屏数据通过任务执行时间戳数据进行关联。

第二方面,本发明还提供了一种任务操作指令映射模型训练数据生成系统,包括:

任务描述脚本组编写模块:用于编写任务描述脚本组,基于实际任务编写若干任务描述脚本,将若干任务描述脚本随机组合成若干任务描述脚本组;

任务描述脚本组执行模块:用于执行任务描述脚本组;

事件日志数据获取模块:用于获取任务描述脚本组执行过程中的事件日志数据;

屏幕录屏数据获取模块:用于获取任务描述脚本组执行过程中的屏幕录屏数据;

时间戳数据获取模块:用于获取任务描述脚本组执行过程中的时间戳数据;

训练数据生成模块:用于构建训练数据,将一组任务描述脚本组、事件日志数据和屏幕录屏数据作为训练样本,构建训练数据集。

进一步的,所述任务描述脚本组包含多个任务描述脚本,所述多个任务描述脚本随机混合执行获得混合了多个任务的操作指令序列。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海艺赛旗软件股份有限公司,未经上海艺赛旗软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111072833.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top