[发明专利]舆情文本的摘要抽取方法、装置、设备及计算机存储介质有效
| 申请号: | 202111510642.2 | 申请日: | 2021-12-10 |
| 公开(公告)号: | CN114201601B | 公开(公告)日: | 2023-03-28 |
| 发明(设计)人: | 陈佳颖 | 申请(专利权)人: | 北京金堤科技有限公司 |
| 主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F40/279 |
| 代理公司: | 北京合智同创知识产权代理有限公司 11545 | 代理人: | 李杰;舒道宏 |
| 地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 舆情 文本 摘要 抽取 方法 装置 设备 计算机 存储 介质 | ||
本申请实施例提供了一种舆情文本的摘要抽取方法、装置、设备及计算机存储介质,涉及计算机技术领域。其中,所述方法包括:分别确定待抽取摘要的舆情文本中的各个语句与所述舆情文本的文本标题的相似度,并根据所述相似度,确定所述舆情文本中与所述文本标题相匹配的第一类语句;根据所述第一类语句对所述舆情文本进行划分,以获得所述舆情文本的划分区间;针对所述舆情文本的任一划分区间,在所述划分区间中的各个语句中确定出与所述文本标题相匹配的第二类语句;根据所确定的第一类语句和第二类语句,生成所述舆情文本的文本摘要。本方案能够有效保证舆情文本的抽取出的摘要的连贯性和中心主旨性。
技术领域
本申请实施例涉及计算机技术领域,尤其涉及一种舆情文本的摘要抽取方法、装置、电子设备及计算机存储介质。
背景技术
在企业详情页的舆情板块中,用户可以通过该舆情板块了解到一家企业近期发生的事件、新闻等。针对舆情板块,舆情列表展示的内容除了舆情文本的标题之外,还展示了舆情文本的部分正文内容,以补充舆情文本所要表达的主旨。
目前的处理方式为,取舆情文本正文的前N个词语作为补充部分,或者在舆情文本中抽取出若干个语句,并将抽取出的语句拼接组成舆情文本的摘要。但现有方式存在的问题是不能保证舆情文本的摘要的连贯性,并且还不能保证抽取出的摘要的中心主旨性。
由此可见,如何有效保证舆情文本的抽取出的摘要的连贯性和中心主旨性成为当前亟待解决的技术问题。
发明内容
有鉴于此,本发明实施例所解决的技术问题之一在于提供一种舆情文本的摘要抽取方法、装置、电子设备及计算机存储介质,用以解决现有技术中存在的如何有效保证舆情文本的抽取出的摘要的连贯性和中心主旨性的技术问题。
根据本发明实施例的第一方面,提供了一种舆情文本的摘要抽取方法,所述方法包括:分别确定待抽取摘要的舆情文本中的各个语句与所述舆情文本的文本标题的相似度,并根据所述相似度,确定所述舆情文本中与所述文本标题相匹配的第一类语句;根据所述第一类语句对所述舆情文本进行划分,以获得所述舆情文本的划分区间;针对所述舆情文本的任一划分区间,在所述划分区间中的各个语句中确定出与所述文本标题相匹配的第二类语句;根据所确定的第一类语句和第二类语句,生成所述舆情文本的文本摘要。
根据本发明实施例的第二方面,提供了一种舆情文本的摘要抽取装置,所述装置包括:第一确定模块,用于分别确定待抽取摘要的舆情文本中的各个语句与所述舆情文本的文本标题的相似度,并根据所述相似度,确定所述舆情文本中与所述文本标题相匹配的第一类语句;划分模块,用于根据所述第一类语句对所述舆情文本进行划分,以获得所述舆情文本的划分区间;第二确定模块,用于针对所述舆情文本的任一划分区间,在所述划分区间中的各个语句中确定出与所述文本标题相匹配的第二类语句;生成模块,用于根据所确定的第一类语句和第二类语句,生成所述舆情文本的文本摘要。
根据本发明实施例的第三方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如第一方面所述的舆情文本的摘要抽取方法对应的操作。
根据本发明实施例的第四方面,提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的舆情文本的摘要抽取方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金堤科技有限公司,未经北京金堤科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111510642.2/2.html,转载请声明来源钻瓜专利网。





