[发明专利]基于槽位语义交互的大坝应急工况事件检测方法和系统有效
| 申请号: | 202310912326.0 | 申请日: | 2023-07-25 |
| 公开(公告)号: | CN116627915B | 公开(公告)日: | 2023-09-19 |
| 发明(设计)人: | 李锴凌 | 申请(专利权)人: | 河海大学 |
| 主分类号: | G06F16/16 | 分类号: | G06F16/16;G06F16/18;G06F40/186;G06F40/284;G06F16/35;G06N3/0455 |
| 代理公司: | 南京乐羽知行专利代理事务所(普通合伙) 32326 | 代理人: | 李玉平 |
| 地址: | 211100 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 语义 交互 大坝 应急 工况 事件 检测 方法 系统 | ||
本发明公开一种基于槽位语义交互的大坝应急工况事件检测方法和系统,对大坝安全运行日志数据进行拆分排序;构造带槽位的识别问题模板,利用BART模型编码上下文向量,利用交叉注意力实现槽位语义交互,捕捉与触发词相关的上下文特征,提取触发词向量,结合上下文向量和触发词向量构建标签选择器并标注触发词;之后用识别到的触发词填充槽位,构造分类问题模板,并基于槽位语义交互提取类型特征向量,进行触发词分类,从而实现事件检测。本发明无需依赖外部分词和标注工具,通过问题槽位与上下文间的语义交互,增强上下文关联能力,避免了一词多义问题导致的分类准度下降;将事件检测分为触发词识别和分类两个阶段,有利于提高模型的泛化能力。
技术领域
本发明涉及一种基于槽位语义交互的大坝应急工况事件检测方法和系统,对大坝安全运行日志数据包含的应急工况事件及其应对事件进行事件检测,属于文本数据处理技术领域。
背景技术
事件检测的目标是从非结构化的自然语言文本中识别事件触发词并正确分类事件类型。事件触发词是表示事件发生的核心单元,通常为动词或名词短语。事件类型则需要在数据集中预先定义。事件检测任务是事件抽取的关键子任务,在事件语义建模中有基础性的作用。
在水利领域,大坝能够起到防洪、发电、供水、改善航运等作用,关乎经济、国防与民生。大坝在运行过程中,易受如洪水、地震、暴雨等自然灾害的影响,可能会引发严重的大坝安全事故。因此,在特殊工况如洪水、泥石流、地震等发生后,大坝工作人员会及时进行应急处置与调查评估,对应急工况事件进行记录。同时,大坝巡检人员也会进行日常的巡检与维护,形成日常巡检报告。大坝在长周期的运行过程中,积累了大量的事件记录和巡检报告数据,人工方式难以快速地从中挖掘出重要的应急工况事件,不利于大坝的管理和维护。因此,实现自动化的大坝应急工况事件检测具有重要意义。
事件由触发词和事件论元组成,而触发词存在一词多义的现象,需要结合上下文来判断语义;传统序列标注方法结合上下文的能力较弱,容易过度关注触发词,导致分类错误;无触发词的事件检测方法虽然能解决一词多义问题,但由于触发词是事件的核心单元,缺少触发词不利于后续的事件论元抽取任务;此外,目前中文事件检测方法常常依赖于外部工具进行分词、词性标注、命名实体识别等,可能引入外部错误,增加训练难度。
发明内容
发明目的:针对现有技术中存在的问题和不足,本发明引入了编码器-解码器结构,提出了基于槽位语义交互的大坝应急工况事件检测方法和系统,无需预先进行分词或词性标注,并通过问题槽位与上下文间的语义交互来增强模型的上下文结合能力,从大坝安全运行日志中检测应急工况事件,并标注文档中的事件触发词及其所属事件类型,便于后续抽取事件论元。
技术方案:一种基于槽位语义交互的大坝应急工况事件检测方法,包括如下步骤:
步骤1,数据预处理:首先将大坝安全运行日志文件按日期拆分为多个文档并排序,然后对文档按最大长度拆分为待检测文本;所述按日期拆分是指将整个日志文件按照其中记录的日期划分为多个文档;所述排序是指将文档按其记录日期顺寻排序;所述待检测文本是指要输入BART模型进行事件检测的文本;
步骤2,构造识别问题模板:用自然语言构造带槽位的识别问题模板,将最符合触发词含义的词语填入槽位,以引导BART模型识别触发词;
步骤3,上下文编码:将待检测文本输入BART模型编码,得到上下文向量;
步骤4,基于槽位语义交互提取触发词向量:将待检测文本和识别问题模板分别输入BART模型的编码器组件和解码器组件,利用编码器与解码器间的交叉注意力,捕捉与槽位语义相关的上下文特征,融合为触发词向量;
步骤5,构建标签选择器标注触发词:使用触发词向量构造BIO标签选择器,根据上下文向量计算每个字的标签分数,然后利用条件随机场计算标签序列概率,标注出待检测文本中的触发词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310912326.0/2.html,转载请声明来源钻瓜专利网。





