[发明专利]文本的摘要生成方法、装置、电子设备及可读介质在审
| 申请号: | 202111277688.4 | 申请日: | 2021-10-29 |
| 公开(公告)号: | CN114090731A | 公开(公告)日: | 2022-02-25 |
| 发明(设计)人: | 涂曼姝;龚能 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/335;G06F40/194 |
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
| 地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 摘要 生成 方法 装置 电子设备 可读 介质 | ||
本发明实施例提供了一种文本的摘要生成方法、装置、电子设备以及可读介质,所述方法包括:获取预设文本的各个原始文本句,并确定每一个原始文本句与预设文本中其他文本句之间的相关性分值,根据原始文本句的相关性分值,筛选出原始文本句对应的候选文本句,接着根据候选文本句,生成预设文本的文本摘要,从而在对长文本进行摘要生成时,通过文本中各个语句之间的相关性,筛选出相关性高的语句作为文本的摘要,有效保证了文本摘要的连贯性,且语句是基于原文进行抽取,使所生成的摘要能够有效地表达原文的含义,保证了摘要与原文之间的匹配度。
技术领域
本发明涉及文本处理技术领域,特别是涉及一种文本的摘要生成方法、一种文本的摘要生成装置、一种电子设备以及一种计算机可读介质。
背景技术
随着文本信息的爆炸式增长,人们每天能接触到海量的文本信息,如新闻、会议记录、博客、聊天、报告、论文、微博等。其中,对于长目标文本摘要等总结性工作如工作会议记录和总结等,大多数都由人工完成,这一工作无疑大大损耗了劳动者的时间和人力。因此,从大量文本信息提取重要的内容变得越来越重要,自动目标文本摘要这项可以使用户更快速、准确地获取信息的技术也因此应运而生。从大量文本信息中提取重要的内容,已成为我们的一个迫切需求,而自动目标文本摘要(Automatic Text Summarization)则提供了一个高效的解决方案。自动目标文本摘要技术对文档信息进行有效的压缩提炼,帮助用户从海量信息中检索出所需的相关信息,避免通过搜索引擎来检索可能产生过多冗余片面信息的问题,有效地解决了信息过载的问题。然而,在采用相关技术对长文本进行摘要生成的过程中,一方面为了保证内容完整性则容易存在摘要内容多且杂以及概括性弱等问题,另一方面为了摘要足够简洁则容易忽略重要信息导致内容不连贯,以及无法保证文本的中心思想,导致偏离文本表达的真正含义等问题。
发明内容
本发明实施例是提供一种文本的摘要生成方法、装置、电子设备以及计算机可读存储介质,以解决或部分解决相关技术中在对文本进行摘要生成的过程中,存在摘要的连贯性差以及容易偏离文本表达的含义的问题。
本发明实施例公开了一种文本的摘要生成方法,包括:
获取预设文本,所述预设文本包括若干个原始文本句;
确定各所述原始文本句与其他文本句之间的相关性分值;
根据所述相关性分值,从各所述原始文本句中提取候选文本句;
根据所述候选文本句,生成所述预设文本对应的目标文本摘要。
可选地,所述确定各所述原始文本句与其他文本句之间的相关性分值,包括:
将所述原始文本句输入语句相关性模型,获得所述原始文本句与所述预设文本中其他文本句之间的相关性分值。
可选地,所述根据所述相关性分值,从各所述原始文本句中提取候选文本句,包括:
采用所述原始文本句的各相关性分值,生成所述原始文本句的语句分值;
将所述预设文本中语句分值大于或等于预设分值阈值的原始文本句作为所述预设文本的候选文本句。
可选地,所述根据所述候选文本句,生成所述预设文本对应的目标文本摘要,包括:
根据各个所述候选文本句的所述语句分值与对应的各个所述相关性分值,确定起始文本句以及至少一个关联文本句;
采用所述起始文本句与所述至少一个关联文本句,生成所述预设文本对应的目标文本摘要。
可选地,所述根据各个所述候选文本句的所述语句分值与对应的各个所述相关性分值,确定起始文本句以及至少一个关联文本句,包括:
将所述预设文本中语句分值最大的候选文本句作为起始文本句;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111277688.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理的方法和装置
- 下一篇:结构图的结构还原方法和装置





