[发明专利]事件聚类/脉络构建方法及其相关装置、设备和存储介质在审
| 申请号: | 202111509493.8 | 申请日: | 2021-12-10 |
| 公开(公告)号: | CN114357159A | 公开(公告)日: | 2022-04-15 |
| 发明(设计)人: | 赵崇帅;代旭东;顾成敏;周维;李宝善;陈志刚 | 申请(专利权)人: | 科大讯飞股份有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06F40/30 |
| 代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 刘希 |
| 地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 事件 脉络 构建 方法 及其 相关 装置 设备 存储 介质 | ||
本申请公开了一种事件聚类/脉络构建方法及其相关装置、设备和存储介质,其中,事件聚类方法包括:获取候选文本;基于候选文本中词语的结构特征和语义特征分别抽取候选文本的关键词,形成每个候选文本的关键词子图;基于关键词子图将关键词划分为若干个社区,并根据每个候选文本的关键词分别将候选文本聚类至社区中;在每个社区中,基于关键词子图将描述同一事件的候选文本聚类到同一事件节点中。上述方案,能够提高事件聚类的准确性。
技术领域
本申请涉及信息处理技术领域,特别是涉及一种事件聚类/脉络构建方法及其相关装置、设备和存储介质。
背景技术
在信息爆炸的今天,每天都有海量的新闻报道等各种文本涌现,与此同时,这些文本包含大量冗余或重叠的信息,且可能涉及到不同的话题,普通读者越来越难消化大量的文本。因此,越来越多的学者致力于研究如何从海量的文本中快速、准确地归纳出读者感兴趣的事件。
目前,有将包括相同关键词的文本聚类到一起,从而对海量文本进行事件聚类的技术,例如,对于“A公司获颁中国首个5G无线电通信设备进网许可证”与“A公司孟某被捕案最新进展”两个文本,可能仅因为均包括A公司这个关键词,就简单地聚类到一起,实质上两个文本分别描述的是两个事件,导致事件聚类的准确性低。有鉴于此,如何提高事件聚类的准确性成为亟待解决的问题。
发明内容
本申请主要解决的技术问题是提供一种事件聚类/脉络构建方法及其相关装置、设备和存储介质,能够提高事件聚类的准确性。
为了解决上述技术问题,本申请第一方面提供了一种事件聚类方法,包括:获取候选文本;基于所述候选文本中词语的结构特征和语义特征分别抽取所述候选文本的关键词,形成每个所述候选文本的关键词子图;基于所述关键词子图将所述关键词划分为若干个社区,并根据每个所述候选文本的关键词分别将所述候选文本聚类至所述社区中;在每个所述社区中,基于所述关键词子图将描述同一事件的所述候选文本聚类到同一事件节点中。
为了解决上述技术问题,本申请第二方面提供了一种事件脉络构建方法,包括:利用上述第一方面的事件聚类方法获取事件节点后,所述方法还包括:对所述事件节点进行结构化显示,构建若干个故事树。
为了解决上述技术问题,本申请第三方面提供了一种事件聚类装置,包括:候选文本获取模块、形成模块、第一聚类模块和第二聚类模块;候选文本获取模块,用于获取候选文本;形成模块,用于基于所述候选文本中词语的结构特征和语义特征分别抽取所述候选文本的关键词,形成每个所述候选文本的关键词子图;第一聚类模块,用于基于所述关键词子图将所述关键词划分为若干个社区,并根据每个所述候选文本的关键词分别将所述候选文本聚类至所述社区中;第二聚类模块,用于在每个所述社区中,基于所述关键词子图将描述同一事件的所述候选文本聚类到同一事件节点中。
为了解决上述技术问题,本申请第四方面提供了一种事件脉络构建装置,包括:事件节点获取模块和构建模块;事件节点获取模块,用于获取事件节点;构建模块,用于对所述事件节点进行结构化显示,构建若干个故事树。
为了解决上述技术问题,本申请第五方面提供了一种电子设备,该电子设备包括相互耦接的存储器和处理器,所述处理器用于执行所述存储器中存储的程序指令,以实现上述第一方面中的事件聚类方法,或实现上述第二方面中的事件脉络构建方法。
为了解决上述技术问题,本申请第六方面提供了一种计算机可读存储介质,其上存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面中的事件聚类方法,或实现上述第二方面中的事件脉络构建方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111509493.8/2.html,转载请声明来源钻瓜专利网。





