[发明专利]一种基于卷积神经网络的矿山灾害事件检测方法有效
申请号: | 201911117563.8 | 申请日: | 2019-11-15 |
公开(公告)号: | CN110930008B | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 刘鹏;魏卉子;赵崇帅;鹿晓龙;舒雅;冯琳;吴攀鑫;刘兵;丁恩杰 | 申请(专利权)人: | 中国矿业大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/06;G06N3/04;G06N3/08 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 李悦声 |
地址: | 221116 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 矿山 灾害 事件 检测 方法 | ||
一种基于卷积神经网络的矿山灾害事件检测方法,适用于煤矿灾害类事件检测使用。包括模型设计和模型训练两部分,模型设计部分主要包括混合特征输入层和高速迭代空洞卷积神经网络的设计两部分,通过混合输入文本词级、字符级和实体特征向量,构建细粒度和语义性更强的特征输入层,充分挖掘文本深层语义和结构信息,通过采用迭代法堆叠DCNN构建深层模型,获取全局特征向量,提高模型训练效率,模型后端框架选用Highway网络连接Softmax分类层优化特征向量,改善训练深层网络模型易过拟合和收敛难的问题,提高模型检测的准确性。能够自动检测海量文本数据中的矿山灾害事件,避免繁琐的人工构建操作,为矿山灾害事件的分析及预警提供数据支撑。
技术领域
本发明涉及一种矿山灾害事件检测方法,尤其适用于构建矿山灾害事件库检测灾害的基于卷积神经网络的矿山灾害事件检测方法。
背景技术
随着互联网的深入发展,矿山从业人员可以在线搜集整理矿山灾害类新闻数据,分析预测矿山灾害事件,但这类非结构化数据具有规模较大、异构多元、组织结构松散等特点,采用基于模板或统计的传统信息抽取技术难以高效的挖掘灾害事件信息,基于深度模型的研究越来越广泛。
早期有Heng、Yu Hong、Shulin Liu等学者构建模板库完成事件抽取,抽取效果较好,但是需人工构建模板,耗时耗力,系统可扩展性及可迁移性都比较差;Shaoyang等人将LSTM模型用于篇章级文本的事件检测,获取全局特征,但模型的训练效率低下。越来越多学者将深度学习模型迁移到自然语言处理领域,其中应用最多的是CNN和LSTM,理论上单元连续的LSTM能够顺序提取文本的全局特征,但参数量随文本长度变化,因此往往需要庞大的参数才能处理篇章级文本,造成模型训练效率低下以及实际应用困难。而CNN的参数量随层数变化,叠加多层便可处理篇章级文本,相较LSTM参数量大大减少,但是CNN每次卷积操作处理的文本范围有限,即感受野范围有限,只能获取局部特征,语义不连贯较为明显。Hu等人首次将CNN模型用于句子级别的事件检测,未能获取文本的全局信息;Yubo等人将多池化层CNN模型用于句子级别的事件检测,使用池化思想扩充感受野范围,增强语义连贯性,依然未能覆盖篇章级文本。尚未有关于矿山灾害事件检测的相关研究,况且上述深度模型均基于ACE2005语料集研究事件检测任务,语料集中各类事件均包含触发词信息,触发词的种类繁多、表述方式差异明显,采用序列标注思想识别并标注触发词事件类别信息,可在一定程度上消除触发词歧义。然而,大量矿山类新闻数据中各类灾害事件的触发词表述近似,多为“发生”、“出现”等词,区分度低且存在大量无触发词数据,难以借助序列标注思想检测该类数据。
发明内容
发明内容:针对上述技术问题的不足之处,本发明提出方法简单,检测效果好,适用性好,事件检测准确性高的基于卷积神经网络的矿山灾害事件检测方法。
为实现上述技术目的,本发明的基于改进卷积神经网络的矿山灾害事件检测方法,首先构建矿山灾害类事件语料集,然后设计检测模型架构,利用设计的检测模型架构训练检测模型及检测新文本所含事件信息;
具体步骤如下:
步骤一、首先构建矿山灾害类事件语料集,包括三个阶段:
a1分析及整理矿山灾害事件类别体系,将矿山灾害类事件语料集为一条文本对应一个灾害类事件标签的结构生成矿山灾害类事件语料库,若文本中包含某类矿山灾害事件,则为其标注相应的事件类别,若不包含事件类别,标记为无灾害类事件;
a2从网络和各大数据控中根据灾害事件体系有针对性的搜集灾害事件信息;
a3将收集的矿山灾害类事件信息分配相应的事件标签,包含灾害事件信息则分配相应的灾害事件类别标签,不包含则分配无灾害事件标签,即完成矿山灾害类事件语料集的构建;
步骤二、设计检测模型架构,检测模型架构分为混合特征输入层和模型主体框架层的设计2部分:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国矿业大学,未经中国矿业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911117563.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:微波炉及其控制方法、装置以及存储介质
- 下一篇:芯片封装缺陷的视觉检测方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理