[发明专利]电力舆情事件的抽取方法、装置、电子设备及存储介质在审
| 申请号: | 202211495906.6 | 申请日: | 2022-11-23 |
| 公开(公告)号: | CN115730071A | 公开(公告)日: | 2023-03-03 |
| 发明(设计)人: | 张强;毛光辉;付慧;金焱;马径坦;宋博川 | 申请(专利权)人: | 国网智能电网研究院有限公司;国网江苏省电力有限公司;国家电网有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30;G06F18/214 |
| 代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 李静玉 |
| 地址: | 102209 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 电力 舆情 事件 抽取 方法 装置 电子设备 存储 介质 | ||
本发明实施例涉及一种电力舆情事件的抽取方法、装置、电子设备及存储介质,包括:获取电力舆情数据;对所述电力舆情数据进行事件检测,标注含有事件类型标签的目标语句;抽取所述目标语句中的论元角色;将所述目标语句对应的事件类型与抽取到的论元角色按照预设格式组合,得到电力舆情事件。由此,可以从大量的电力舆情文本中自动、快捷的将其包含的多个事件信息同时抽取出来,提高了电力舆情事件的识别准确率和抽取效率。
技术领域
本发明实施例涉及数据处理领域,尤其涉及一种电力舆情事件的抽取方法、装置、电子设备及存储介质。
背景技术
随着网络技术的快速发展,互联网上每天都会有大量电力舆情相关的新闻报道等文本数据产生,这些文本数据可以帮助广大民众了解电力舆情有关的热点信息和相关新闻事件。然而,网络上的这些新闻报道相关的文本数据量很大,每篇新闻报道的文本内容也是有多有少,每一篇新闻报道中叙述的事情很难直接快速的了解。针对该问题,对电力舆情相关的新闻报道进行语义分析的研究,从而可以及时获取热点事件的关键信息,了解舆论动态,同时也可以帮助相关的监管者及时的了解电力相关的舆论,协助其进行快速有效的决策。
现有的事件信息抽取方法包括:基于机器学习的事件抽取方法和基于规则的事件抽取方法,但是这两种方法存在抽取信息精准度低或操作繁琐等问题,不能精准、快速的获取热点事件的关键信息。
发明内容
鉴于此,为解决上述技术问题或部分技术问题,本发明实施例提供一种电力舆情事件的抽取方法、装置、电子设备及存储介质。
第一方面,本发明实施例提供一种电力舆情事件的抽取方法,包括:
获取电力舆情数据;
对所述电力舆情数据进行事件检测,标注含有事件类型标签的目标语句;
抽取所述目标语句中的论元角色;
将所述目标语句对应的事件类型与抽取到的论元角色按照预设格式组合,得到电力舆情事件。
在一个可能的实施方式中,所述方法还包括:
对所述电力舆情数据进行预处理,得到预处理后的电力舆情数据;
将预处理后的电力舆情数据输入预先训练的事件检测模型中,对每个语句标注对应的事件类型标签,得到含有事件类型标签的目标语句。
在一个可能的实施方式中,所述方法还包括:
将所述含有事件类型标签的目标语句输入预先训练的论元角色抽取模型中,对每个论元角色进行识别并标注对应的论元角色标签,得到带有论元角色标签的多个论元角色。
在一个可能的实施方式中,所述方法还包括:
构建电力舆情事件Schema;
将所述目标语句、所述目标语句对应的事件类型、抽取到的论元角色添加到所述电力舆情事件Schema中。
在一个可能的实施方式中,所述方法还包括:
识别每个语句是否包含事件类型,将包含事件类型的语句进行标记;
对标记过的包含事件类型的语句进行事件类型识别,对包含事件类型的语句标记对应的事件类型标签,得到含有事件类型标签的目标语句。
在一个可能的实施方式中,所述方法还包括:
对含有事件类型标签的目标语句进行事件编码,将所述事件编码输入至预先训练的论元角色抽取模型中,识别论元角色特征、语义角色特征和事件类型特征;
基于所述论元角色特征、语义角色特征和事件类型特征,得到事件类型对应的带有论元角色标签的多个论元角色。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网智能电网研究院有限公司;国网江苏省电力有限公司;国家电网有限公司,未经国网智能电网研究院有限公司;国网江苏省电力有限公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211495906.6/2.html,转载请声明来源钻瓜专利网。





