[发明专利]基于文本挖掘的安全生产事故分析方法、装置、电子设备以及存储介质有效

专利信息
申请号: 202011148727.6 申请日: 2020-10-23
公开(公告)号: CN112364627B 公开(公告)日: 2023-07-25
发明(设计)人: 张健钦;程宇航;李江川;张安 申请(专利权)人: 北京建筑大学
主分类号: G06F40/216 分类号: G06F40/216;G06F16/35;G06F16/36;G06Q50/26
代理公司: 北京远大卓悦知识产权代理有限公司 11369 代理人: 卞静静
地址: 102616 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 文本 挖掘 安全生产 事故 分析 方法 装置 电子设备 以及 存储 介质
【说明书】:

发明实施例公开了基于文本挖掘的安全生产事故分析方法、装置、电子设备以及存储介质。该方法包括:获取安全生产事故文本数据,其中,所述安全生产事故文本数据包括分属于多个事故等级的多个事故文本;采用TF‑IDF方法,从所述安全生产事故文本数据中提取多个关键词,其中,任一关键词的权重与当前关键词在与其所在的事故文本属于相同事故等级的事故文本中的出现频率成正比;根据所述多个关键词,确定所述安全生产事故的致因因素。基于该方法和装置,可以实现对于安全生产事故内在特征的有效挖掘,进而提高对于安全生产事故分析的准确性。

技术领域

本发明实施例涉及计算机技术领域,尤其涉及基于文本挖掘的安全生产事故分析方法、装置、电子设备以及存储介质。

背景技术

交通行业是我国经济结构中的先行和基础产业,是制约经济与社会发展的重要因素。尽管北京市交通行业事故起数、死亡失踪人数、重特大事故逐年下降,但交通行业安全生产事故时有发生,安全生产形势仍然十分严峻。然而现阶段通过人工监管的方式,远远不能满足目前巨大体量的交通行业管理需要,应急防控能力亟待增强。

交通行业安全生产事故数据采用文本的形式进行人工记录并存储,有效挖掘并利用对提升安全生产事故的防控治理工作能力具有重大意义。目前,国内学者在交通行业领域内的研究有:李凤伟等学者通过对2003-2010年期间发生的118个地铁安全生产事故进行统计分析,从事故发生时间、所在城市、事故类型、所在区域等方面揭示地铁施工事故规律;林庆丰、邓院昌选取2017年发生的3337起交通事故,分析事故严重程度的影响因素。这些研究仅仅是基于简单的统计分析,没有深入挖掘。近年来随着大数据技术的兴起,利用多种方式处理数据并进行知识挖掘及可视化分析成为研究热点,但目前交通行业内的研究仍然不能有效揭示出安全生产事故的内在特征,进而影响对于安全生产事故的致因因素的分析。

发明内容

本发明实施例的一个目的是解决至少上述问题和/或缺陷,并提供至少后面将说明的优点。

本发明实施例提供了基于文本挖掘的安全生产事故分析方法、装置、电子设备以及存储介质,可以实现对于安全生产事故内在特征的有效挖掘,进而提高对于事故致因因素分析的准确性。

第一方面,提供了一种基于文本挖掘的安全生产事故分析方法,包括:

获取安全生产事故文本数据,其中,所述安全生产事故文本数据包括分属于多个事故等级的多个事故文本;

采用TF-IDF方法,从所述安全生产事故文本数据中提取多个关键词,其中,任一关键词的权重与当前关键词在与其所在的事故文本属于相同事故等级的事故文本中的出现频率成正比;

根据所述多个关键词,确定所述安全生产事故的致因因素。

可选地,所述当前关键词在与其所在的事故文本属于相同事故等级的事故文本中的出现频率为根据含有当前关键词的并且与当前关键词所在的事故文本属于相同事故等级的事故文本数在含有当前关键词的事故文本总数中的占比计算得出。

可选地,所述任一关键词的权重还与当前关键词在其所在的事故文本中的出现频率成正比,而与当前关键词在所述多个事故文本中的出现频率成反比。

可选地,所述任一关键词的权重通过以下公式计算得出:

Scoreij=tfij×idfij

其中,Scoreij代表第i个事故文本中第j个关键词的权重,tfij代表第j个关键词在第i个事故文本中的出现频率,idfij代表第i个事故文本中第j个关键词的逆向文件频率;

所述当前关键词的逆向文件频率通过以下公式计算得出:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京建筑大学,未经北京建筑大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011148727.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top