[发明专利]一种基于机器学习的工单分派方法和系统在审
| 申请号: | 202011634895.6 | 申请日: | 2020-12-31 |
| 公开(公告)号: | CN112308251A | 公开(公告)日: | 2021-02-02 |
| 发明(设计)人: | 张蔓琪 | 申请(专利权)人: | 北京蒙帕信创科技有限公司 |
| 主分类号: | G06Q10/00 | 分类号: | G06Q10/00;G06N20/00;G06K9/62;G06F16/35;G06F40/289 |
| 代理公司: | 北京市隆安律师事务所 11323 | 代理人: | 杨云 |
| 地址: | 100022 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 机器 学习 分派 方法 系统 | ||
本发明涉及一种基于机器学习的工单分派方法和系统,该方法包括以下步骤:建立数据库存储采集的故障信息,并从所述数据库获取故障数据;根据改进的TF‑IDF算法对所述故障数据进行预处理,其中所述故障数据包括训练故障数据和测试故障数据;建立基于属性赋值改进的KNN算法的机器学习模型,利用所述训练故障数据的分类信息通过层次分析法对所述模型进行训练;以及利用训练好的模型将所述测试故障数据的关键词与所述训练故障数据的分类信息进行匹配,以便根据匹配结果对所述测试故障数据执行相应的操作。该方案对故障信息的分类更精准,使得工单的分派更及时可靠,极大提高了运维人员的工作效率和问题解决效率。
技术领域
本发明涉及工单分派的技术领域,尤其涉及一种基于机器学习的工单分派方法和系统。
背景技术
随着互联网数据规模的急剧膨胀,以及IT服务类型的复杂多样,如何在巨大的信息量中更加有效地发现和使用信息,以及如何利用海量信息提供更高质量和智能化的信息服务,越来越被关注。基于“人为制定规则”的传统IT运维自动化系统在对故障数据的关键信息进行提取的过程中,经常会出现提取的关键信息不能有效地反映词语的重要程度和特征词的分布情况。尤其在同类语料库中,问题尤为突出,往往会出现一些同类文本的关键词的权值很小,接近于0,而且精确度也相对低的问题。另外,传统IT运维自动化系统在对故障数据的关键信息进行分类的过程中,由于不同的属性对分类的影响力度相同时,通常会被认定具有相同的权重。从而会导致虽然是不同属性,但是对分类不能产生各自的影响。
发明内容
为了解决现有技术中存在的部分缺点和不足,本发明提出了一种基于机器学习的工单分派方法和系统,通过对现有故障数据的关键词提取过程的改进,可以解决最后权值过小的问题。另外,通过采用层次分析法改进传统的故障预测分类过程,可以给故障数据不同的属性均赋予相对应的权重。因此,可以实现不同属性具有不同的权重,并分别对分类产生不同影响。,提高故障解决效率。
在一个方面中,本公开提供了一种基于机器学习的工单分派方法,其特征在于,该方法包括以下步骤:
建立数据库存储采集的故障信息,并从所述数据库获取故障数据;
根据改进的TF-IDF算法对所述故障数据进行预处理,其中所述故障数据包括训练故障数据和测试故障数据;
建立基于属性赋值改进的KNN算法的机器学习模型,利用所述训练故障数据的分类信息通过层次分析法对所述模型进行训练;以及
利用训练好的模型将所述测试故障数据的关键词与所述训练故障数据的分类信息进行匹配,以便根据匹配结果对所述测试故障数据执行相应的操作。
在一个实施例中,所述改进的TF-IDF算法是基于TF-IDF算法与加权相结合的方式,对所述故障数据的关键词进行抽取。
在另一个实施例中,所述改进的TF-IDF算法的IDF*为:
IDF* = log(语料库中所有词语频数之和/词语在语料库中出现的总频数);
其中IDF* 为逆文档频率。
在又一个实施例中,所述改进的KNN算法通过层次分析法对所述故障数据的不同属性进行不同的权重赋值。
在一个实施例中,建立基于属性赋值改进的KNN算法的机器学习模型,利用所述训练故障数据的分类信息通过层次分析法对模型进行训练,包括:
将所述预处理后的故障数据导入所述模型,并进行归一化处理;
构建层次结构模型,并根据所述层次结构确认各层次之间的判断矩阵,其中所述层次结构包括目标层、准则层和方案层;
初始化目标层与准则层之间的判断矩阵,进行层次单排序;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京蒙帕信创科技有限公司,未经北京蒙帕信创科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011634895.6/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





