[发明专利]一种文本摘要生成方法、装置、电子设备及存储介质有效

专利信息
申请号: 202011479204.X 申请日: 2020-12-15
公开(公告)号: CN112541073B 公开(公告)日: 2022-12-06
发明(设计)人: 吴文涛;周维;陈志刚;谭昶 申请(专利权)人: 科大讯飞股份有限公司
主分类号: G06F16/34 分类号: G06F16/34;G06F3/0484
代理公司: 北京路浩知识产权代理有限公司 11002 代理人: 赵赫
地址: 230088 安徽省*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 文本 摘要 生成 方法 装置 电子设备 存储 介质
【说明书】:

本申请公开一种文本摘要生成方法、装置、电子设备及存储介质,所述方法包括:接收待生成摘要的文本;生成初始文本摘要,通过经训练的文本摘要模型为所述文本生成初始文本摘要;接收到用户通过人机交互方式对所述初始文本摘要的改进请求;生成合成文本摘要,当接收到所述改进请求时,通过所述经训练的文本摘要模型并且根据所述文本生成基于所述初始文本摘要且体现所述预定内容的合成文本摘要。该方法不仅具备生成能力还具有融合核心句上下文的能力,保证生成的摘要包括核心句子,内容上具有概括性和连续性。通过人与文本交互,融入人对文本的理解,防止生成摘要遗漏重要核心的内容,进一步提升生成摘要的效果。

技术领域

本申请涉及自然语言处理技术领域,尤其涉及一种文本摘要生成方法、装置、电子设备和存储介质。

背景技术

随着互联网技术普及,人们接收信息越来越容易。同时,信息的爆炸也带来了“信息过载”问题。信息爆炸使得人们要面对海量信息,从海量信息中智能、迅速的获取摘要信息成为了一项重要且具有挑战性的课题。

在我们日常生活中,摘要技术的应用能给我们的生活带来便利。如手机上的新闻APP,我们只要通过浏览新闻标题就可以大致了解到该新闻描述的事情,是否对这篇新闻感兴趣,决定是否继续浏览,杜绝被“标题党”误导,这为我们节约了很多时间。因此,摘要的生成质量对我们有很大影响。如果摘要生成的质量较差,则浪费我们很多时间,在这个需要快速获得符合个体化需求的精准信息的时代,生成符合个体化需求的摘要也尤为重要。另外,在工作中,我们会经常碰到需要将冗长的文件提炼成一段简短且概括的段落,这样的工作不仅耗时且枯燥,在总结过程中容易丢失重要信息。在这种情况下,以提高摘要生成速度和效率的自动摘要技术就显得必不可少。

显然,摘要生成的速度、效率、质量以及是否符合个体化需求将作为摘要生成的优劣的几个重要指标。

目前,不管是采用抽取式还是生成式来获取文本摘要,都存在着一些不足的地方。例如,采用抽取式来获取摘要,抽取出的摘要内容一般多且杂,内容不连贯,不具备概括性,与人工总结的摘要存在一定的语义偏差。但是人工总结摘要存在摘要生成速度太慢的问题。采用生成式来获取摘要,容易忽略重要信息,抓不住文本的核心,偏离了文本表达的真正含义,以及生成摘要的质量不可控等问题,导致生成的摘要不能用,还有一些生成的摘要内容晦涩难懂,影响用户的使用体验。

因此,提高摘要生成的速度和效率、质量以及最大程度的满足个体化需求显得尤为重要。

发明内容

有鉴于此,本申请提供了一种文本摘要方法、装置、电子设备和存储介质,用以解决现有摘要方法摘要生成的质量欠佳、速度和效率低下、不符合用户的个体化需求的问题。

第一方面,本申请提供了一种文本摘要生成方法,该方法包括:

接收待生成摘要的文本;

通过人机交互生成文本摘要,所述通过人机交互生成文本摘要包括:

用户与所述文本进行交互以从所述文本中指定预定内容;

经训练的文本摘要模型根据所述文本的内容且基于至少所述预定内容来生成包括所述预定内容的文本摘要。

优选地,经训练的文本摘要模型根据所述文本的内容且基于至少所述预定内容来生成包括所述预定内容的文本摘要包括:

根据所述文本的内容来融合所述预定内容,以使生成的文本摘要中的所述预定内容和所述预定内容的上下文之间通顺、连贯。

优选地,经训练的文本摘要模型根据所述文本的内容且基于至少所述预定内容来生成包括所述预定内容的文本摘要包括:

经训练的文本摘要模型根据所述文本的内容且基于至少所述预定内容来生成包括所述预定内容的至少一个摘要;

从所述至少一个摘要中选择最终的文本摘要。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011479204.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top