[发明专利]基于机器故障和文本主题分析的城轨折返故障诊断方法在审
申请号: | 202110340750.3 | 申请日: | 2021-03-30 |
公开(公告)号: | CN112884179A | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 马思琦;王鑫;王笑辰;刘涵宇;赵步天;张润彤 | 申请(专利权)人: | 北京交通大学 |
主分类号: | G06Q10/00 | 分类号: | G06Q10/00;G06Q50/30;G06K9/62;G06F40/289;G06F40/216;G06F16/26;G06F16/215 |
代理公司: | 长沙轩荣专利代理有限公司 43235 | 代理人: | 李喆 |
地址: | 100089 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 故障 文本 主题 分析 折返 故障诊断 方法 | ||
1.一种基于机器故障和文本主题分析的城轨折返故障诊断方法,其特征在于,包括:
步骤1,获取各个城轨的通信码和工程师的维修报告并构建数据库;
步骤2,对数据库中各个城轨的通信码通过基于Spark的频繁项集生成算法挖掘频繁出现在各个城轨通信码中的特征组合并分析,得到故障发生的规则,通过笛卡尔积算法将各个城轨通信码中单独的离散特征进行特征交叉,通过所有通信码的特征训练梯度提升决策树算法,以分别在城轨无人自动折返、自动换端和点式换端中发生故障时进行自动分类,并分别计算各个类别预测的F1-Score并分析,得到机器诊断结果;
步骤3,对数据库中各个城轨的维修报告中的数据进行中文文本清洗;
步骤4,对文本清洗后的各个城轨的维修报告进行主题分析,并计算维修报告文本的主题概率分布,得到人工检测的判断规则;
步骤5,根据机器诊断结果和人工检测的判断规则进行城轨折返故障诊断。
2.根据权利要求1所述的基于机器故障和文本主题分析的城轨折返故障诊断方法,其特征在于,所述步骤2具体包括:
通过基于Spark的频繁项集生成算法对所有城轨通信码中的特征进行扫描和计数,将一个特征作为一个项集,生成一阶候选项集,预设最小频繁项集生成支持度,将一阶候选项集中的每个项集的计数值与预设的最小频繁项集生成支持度进行比较,当当前项集的计数值大于或等于预设的最小频繁项集生成支持度时,将当前项集和当前项集的计数值保存,继续将下一个项集的计数值与预设的最小频繁项集生成支持度进行判断;当当前判断的项集的计数值小于预设的最小频繁项集生成支持度时,将当前项集和当前项集的计数值删除,继续将下一个项集的计数值与预设的最小频繁项集生成支持度进行判断,直到判断完一阶候选项集中的所有项集,基于所有保存的项集和项集相对应的计数值,生成频繁项集;将当前频繁项集中的两个相关特征组合为一个项集并计数,生成二阶候选项集,将二阶候选项集中的每个项集的计数值与预设的最小频繁项集生成支持度进行比较,得到比较后保存的项集和项集的计数值,基于保存的项集和项集的计数值生成新的频繁项集;将新的频繁项集中的三个相关特征组合为一个项集并计数,生成三阶候选项集,将以上过程进行循环迭代,直到没有频繁项集生成时,结束算法,获得所有的频繁项集,对频繁项集进行分析得到故障发生的规则。
3.根据权利要求2所述的基于机器故障和文本主题分析的城轨折返故障诊断方法,其特征在于,所述步骤2还包括:
计算包括特征X和特征Y的频繁项集生成支持度,如下所示:
其中,X表示特征,Y表示特征,T表示所有城轨通信码的数量,σ表示特征出现的次数。
4.根据权利要求3所述的基于机器故障和文本主题分析的城轨折返故障诊断方法,其特征在于,所述步骤2还包括:
通过笛卡尔积算法将各个城轨通信码中单独的离散特征进行组合,如下所示:
P×Q={(x,y)|x∈P∧y∈Q} (2)
其中,P和Q表示特征,x表示从属于特征P的类别,y表示从属于特征Q的类别。
5.根据权利要求4所述的基于机器故障和文本主题分析的城轨折返故障诊断方法,其特征在于,所述步骤2还包括:
采用梯度提升决策树算法对所有通信码的特征进行分类,如下所示:
其中,Fm(a)表示特征回归问题提升树,a表示特征,T(a;βm)表示特征决策树,βm表示特征类别,m表示特征类别的编号,M表示所有特征决策树的总个数,其损失为:
L[b,Fm-1(a)+T(a;βm)]=[b-Fm-1(a)-T(a;βm)]2 (4)
其中,将所有通信码的特征作为训练集I,I={(a1,b1),(a2,b2),...,(an,bn)},b表示特征,Fm-1(a)表示当前特征回归问题提升树。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110340750.3/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理