[发明专利]基于词扩展LDA的铁路事故原因分析方法有效
| 申请号: | 201910562498.3 | 申请日: | 2019-06-26 |
| 公开(公告)号: | CN110472225B | 公开(公告)日: | 2021-05-18 |
| 发明(设计)人: | 张国琛;郑伟 | 申请(专利权)人: | 北京交通大学 |
| 主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06K9/62;G06Q10/06;G06Q50/30 |
| 代理公司: | 北京市商泰律师事务所 11255 | 代理人: | 邹芳德 |
| 地址: | 100044 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 扩展 lda 铁路 事故 原因 分析 方法 | ||
1.一种基于词扩展LDA的铁路事故原因分析方法,其特征在于,包括如下流程步骤:
步骤S110:利用TF-IDF进行铁路事故文本表示,构建文档向量空间模型,生成文档向量;
步骤S120:利用TextRank方法对文档向量中词的重要度进行计算;
步骤S130:根据词重要度和语义相似度,对符合语义阈值的词进行加权,训练生成词扩展LDA模型;
步骤S140:采用词扩展LDA模型进行铁路事故文本特征提取,提取得到铁路事故致因主题和特征项,生成铁路事故报告;
步骤S150:利用SVM事故分类模型对铁路事故报告进行文本分类,确定铁路事故致因数据集;
步骤S160:采用卡方检验结合无约束0/1优化的方法进行贝叶斯网络结构优化;
步骤S170:采用Logistic回归模型结合网络结构的方法进行贝叶斯网络CPT参数估计;
步骤S180:根据改进贝叶斯网络,结合铁路事故致因数据集建立事故致因分析模型,计算得到导致事故后果的关键致因。
2.根据权利要求1所述的基于词扩展LDA的铁路事故原因分析方法,其特征在于,所述步骤S110包括:
将文档中词的词频与逆词频进行结合,并通过平滑处理后计算得到文档中每个词的TF-IDF值,形成文档向量。
3.根据权利要求2所述的基于词扩展LDA的铁路事故原因分析方法,其特征在于,所述步骤S120具体包括:
将给定的事故文本按照完整句子进行分割,对每个句子进行分词,并进行去停用词,将每个句子表示成词组的集合,构建词图,然后采用共现关系构造任两词之间的边,仅当两个词在长度固定的窗口中共现,它们之间才存在边,将所有词的重要度进行初始化,通过多次迭代计算每个单词的重要度,通过设置最大迭代次数来控制计算,最终迭代结果被定义为词的重要度,迭代传播各节点的权重,直至收敛。
4.根据权利要求3所述的基于词扩展LDA的铁路事故原因分析方法,其特征在于,所述步骤S130具体包括:
利用词的重要度扩展原始文档并获得已扩展的文本数据,利用余弦相似度计算文档与词之间的语义相似度,当语义相似度大于语义阈值时,根据词重要度和语义相似度对词的权重进行赋值;当语义相似度小于语义阈值时,根据词重要度对词的权重进行赋值。
5.根据权利要求4所述的基于词扩展LDA的铁路事故原因分析方法,其特征在于,所述步骤S140中具体包括:
将经过文本表示得到的文档向量作为词扩展LDA模型的输入,设定主题数和语义阈值,提取事故致因主题特征项,并对主题含义进行归纳总结。
6.根据权利要求5所述的基于词扩展LDA的铁路事故原因分析方法,其特征在于,所述步骤S150具体包括:
基于HFACS-RAs模型的结构,将“不安全行为的前提条件”分为“不安全行为的个人条件”、“不安全行为的任务条件”和“不安全行为的环境条件”,构建改进的HFACS-RAs模型;其中,包含父类事故致因和子类事故致因,根据父类事故致因与子类事故致因之间的依赖关系,将父类事故致因分类结果作为新的特征加入到所述词扩展LDA模型进行特征提取,实现特征空间维数的扩展。
7.根据权利要求6所述的基于词扩展LDA的铁路事故原因分析方法,其特征在于,所述步骤S160具体包括:
将贝叶斯网络表示为一个邻接矩阵,利用卡方检验构建贝叶斯网络节点中的关联关系度量,形成关联矩阵,将邻接矩阵与关联矩阵结合形成全局因果关系度量,利用无约束0/1优化完成最优邻接矩阵求解,得到最优化贝叶斯网络结构。
8.根据权利要求7所述的基于词扩展LDA的铁路事故原因分析方法,其特征在于,所述步骤S170具体包括:
结合具体贝叶斯网络结构确定要计算的CPT个数,构造Logistic回归模型,初始化Logistic回归模型参数,构造目标函数,利用极大似然法更新Logistic回归模型参数,计算CPT。
9.根据权利要求8所述的基于词扩展LDA的铁路事故原因分析方法,其特征在于,所述步骤S180具体包括:
设定事故或严重风险层的因素为目标节点,分析其它因素对设定因素的敏感程度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910562498.3/1.html,转载请声明来源钻瓜专利网。





