[发明专利]事件抽取方法、装置、计算机设备和计算机可读存储介质有效
| 申请号: | 202110649268.8 | 申请日: | 2021-06-10 |
| 公开(公告)号: | CN113255322B | 公开(公告)日: | 2021-10-01 |
| 发明(设计)人: | 孙俊;黄继青;刘云峰 | 申请(专利权)人: | 深圳追一科技有限公司 |
| 主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/295 |
| 代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 姚姝娅 |
| 地址: | 518057 广东省深圳市南山区粤海街道*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 事件 抽取 方法 装置 计算机 设备 可读 存储 介质 | ||
本申请涉及一种事件抽取方法、装置、计算机设备和计算机可读存储介质。该方法包括:获取目标文本,并对所述目标文本进行分句处理,得到多个分句文本;对所述多个分句文本进行至少两次不同的角色抽取处理,得到各角色抽取处理过程对应的角色抽取结果,并对各所述角色抽取结果进行组合,得到所述目标文本对应的目标角色抽取结果,所述目标角色抽取结果包括所述目标文本对应的多个角色要素;对所述目标角色抽取结果进行事件抽取处理,得到至少一个事件信息,所述事件信息包括事件类型和所述事件类型对应的目标角色要素。采用本方法能够提升事件抽取的准确性。
技术领域
本发明涉及人工智能技术领域,特别是涉及一种事件抽取方法、装置、计算机设备和计算机可读存储介质。
背景技术
事件抽取(Event Extraction, EE)是NLP(Natural Language Processing,自然语言处理)领域中一种经典的信息抽取任务,在商业、军事等领域的应用非常广泛。事件抽取是指从非结构化文本中抽取结构化形式的事件信息。
目前,相关技术也有将事件抽取和ASR(Automatic Speech Recognition,自动语音识别技术)融合,这样,可以对用户的语音进行ASR转换得到非结构化文本,并对该非结构化文本进行事件抽取。
然而,上述基于ASR场景的事件抽取方式存在事件抽取的准确性较低的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提升事件抽取的准确性的事件抽取方法、装置、计算机设备和计算机可读存储介质。
第一方面,本申请实施例提供了一种事件抽取方法,所述方法包括:
获取目标文本,并对所述目标文本进行分句处理,得到多个分句文本;
对所述多个分句文本进行至少两次不同的角色抽取处理,得到各角色抽取处理过程对应的角色抽取结果,并对各所述角色抽取结果进行组合,得到所述目标文本对应的目标角色抽取结果,所述目标角色抽取结果包括所述目标文本对应的多个角色要素;
对所述目标角色抽取结果进行事件抽取处理,得到至少一个事件信息,所述事件信息包括事件类型和所述事件类型对应的目标角色要素。
在其中一个实施例中,所述对所述多个分句文本进行至少两次不同的角色抽取处理,得到各角色抽取处理过程对应的角色抽取结果,包括:
对于每次角色抽取处理过程,按照各所述分句文本在所述目标文本中的排列顺序,将所述多个分句文本分为多个分句组,每个所述分句组包括的所述分句文本的数量相同,不同的角色抽取处理过程对应的分句组的数量不同;
对每个所述分句组对应的分句文本进行角色抽取处理,得到当前角色抽取处理过程对应的所述角色抽取结果。
在其中一个实施例中,所述对每个所述分句组对应的分句文本进行角色抽取处理,得到当前角色抽取处理过程对应的所述角色抽取结果,包括:
对所述分句组对应的分句文本进行实体识别,得到多个关键词;
基于预设的角色要素数据库,对各所述关键词进行角色匹配,并将匹配成功的所述关键词作为初始角色要素,得到所述角色抽取结果。
在其中一个实施例中,所述角色抽取结果包括多个初始角色要素、各所述初始角色要素对应的角色标签以及各所述初始角色要素对应的置信度,所述对各所述角色抽取结果进行组合,得到所述目标文本对应的目标角色抽取结果,包括:
基于各所述角色抽取结果,若目标角色标签对应的初始角色要素的数量为多个,则根据多个所述初始角色要素对应的所述置信度,从多个所述初始角色要素中确定所述目标角色标签对应的角色要素;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳追一科技有限公司,未经深圳追一科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110649268.8/2.html,转载请声明来源钻瓜专利网。





