[发明专利]文本摘要生成方法、装置、计算机设备及可读存储介质在审
| 申请号: | 202010912303.6 | 申请日: | 2020-09-02 |
| 公开(公告)号: | CN112052329A | 公开(公告)日: | 2020-12-08 |
| 发明(设计)人: | 回艳菲;王健宗;程宁 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F40/211;G06F40/289;G06F40/30;G06F40/253;G06K9/62 |
| 代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 武志峰 |
| 地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 摘要 生成 方法 装置 计算机 设备 可读 存储 介质 | ||
本申请实施例提供了一种文本摘要生成方法、装置、计算机设备及计算机可读存储介质。本申请实施例属于自然语言处理技术领域,通过获取待处理文本,及基于待处理文本获取待处理文本所对应的文本向量,将文本向量输入至预设Transformer模型进行处理,以得到待处理文本所对应的第一输出向量,将第一输出向量输入至预设Seq2Seq模型进行处理,以得到待处理文本所对应的第二输出向量,根据第二输出向量生成待处理文本所对应的文本摘要,Transformer使用多头注意力机制弥补了Seq2Seq的缺陷,Transformer和Seq2Seq模型能够充分的互补,实现更丰富的编码向量表示,提升了生成文本摘要的准确性。
技术领域
本申请涉及自然语言处理技术领域,尤其涉及一种文本摘要生成方法、装置、计算机设备及计算机可读存储介质。
背景技术
文本摘要是自然语言处理领域的一项重要研究,根据实现方式不同,将其分为抽取式和生成式。抽取式摘要应用比较简单,并且被广泛使用,其原理主要是摘取文本中的重要句子或段落,将其以某种方式进行拼接并输出。生成式摘要是基于不同的形式对原文本的核心内容以及概念进行重新表示,生成的摘要无需与原文本相同。早期方法是使用图进行人工特征工程,也存在通过计算句子间的相似度,来获取权重最大的几个句子,并对其根据特定的方法进行拼接。现在主要把焦点集中在数据驱动的神经网络上,通过编解码进行文本摘要的生成。
然而传统的方法中,没有对文本数据进行充分的利用,导致进行了不太合理的信息抽取,致使抽取的摘要内容准确性不高。
发明内容
本申请实施例提供了一种文本摘要生成方法、装置、计算机设备及计算机可读存储介质,能够解决传统技术中对摘要内容进行抽取存在准确性较低的技术问题。
第一方面,本申请实施例提供了一种文本摘要生成方法,所述方法包括:获取待处理文本,并基于所述待处理文本获取所述待处理文本所对应的文本向量;将所述待处理文本向量输入至预设Transformer模型进行处理,以得到所述待处理文本所对应的第一输出向量;将所述第一输出向量输入至预设Seq2Seq模型进行处理,以得到所述待处理文本所对应的第二输出向量;根据所述第二输出向量生成所述待处理文本所对应的文本摘要。
第二方面,本申请实施例还提供了一种文本摘要生成装置,包括:获取单元,用于获取待处理文本,并基于所述待处理文本获取所述待处理文本所对应的文本向量;第一输入单元,用于将所述待处理文本向量输入至预设Transformer模型进行处理,以得到所述待处理文本所对应的第一输出向量;第二输入单元,用于将所述第一输出向量输入至预设Seq2Seq模型进行处理,以得到所述待处理文本所对应的第二输出向量;生成单元,用于根据所述第二输出向量生成所述待处理文本所对应的文本摘要。
第三方面,本申请实施例还提供了一种计算机设备,其包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现所述待处理文本摘要生成方法的步骤。
第四方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器执行所述待处理文本摘要生成方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010912303.6/2.html,转载请声明来源钻瓜专利网。





