[发明专利]一种基于自注意力的生成式文本摘要方法有效

专利信息
申请号: 201910511656.2 申请日: 2019-06-13
公开(公告)号: CN110597979B 公开(公告)日: 2023-06-23
发明(设计)人: 田珂珂;印鉴 申请(专利权)人: 中山大学
主分类号: G06F16/34 分类号: G06F16/34;G06F40/284
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 林丽明
地址: 510275 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 注意力 生成 文本 摘要 方法
【说明书】:

发明提供一种基于自注意力的生成式文本摘要方法,该方法抛弃了以往文本摘要方法中常用的循环神经网络结构,转而采用了基于自注意力机制的方法,避免了循环神经网络结构的低效性。此外对于自注意力机制方法在生成摘要效果不佳的缺点,本发明对其该方法进行了改进,简化了其结构,最终实现了高效、准确的文本摘要生成。

技术领域

本发明涉及自然语言处理和文本处理领域,更具体地,涉及一种基于自注意力的生成式文本摘要方法。

背景技术

随着近年来互联网技术的发展,文本信息呈现爆发式增长,人们每天能从各种途径接触到海量的文本信息,如新闻、博客、微信、微博等。大量的文本数据同时也带来了信息过载的问题。根据中国网络信息中心(CNNIC)发布的《第43次中国互联网络发展状况统计报告》显示,截至2018年12月,中国的网民又突破了历史新高,达到了8.29亿人,已经占到了中国总人口的59.6%。其中城镇网民占6.07亿,农村网民占2.22亿。而根据QuestMobile发布的《中国移动互联网2018年半年大报告》显示,中国移动互联网用户对互联网的依赖越发强烈,人均单日使用时长达289.7分钟(近5小时),其中资讯是除过社交和视频之外,最消耗时间的项目,且仍有上升趋势。也就是说,人们每天花费大量的时间,在浏览各式各样的信息上,因此信息过载问题不容忽视。根据社会学研究,信息过载会给人们都来许多现实和心理上的困扰,如浪费时间精力、决策失误、精神压力。在此背景下,自动文本摘要和个性化推荐系统成为了解决信息过载的重要方法,因此这两个领域得以快速发展。

文本摘要,即给定一段长文本,通过提取其中的关键信息,将其精炼成一段短文本或几句话。现有的文本摘要的方法可大致分为两类,抽取式(extractive)和生成式(abstractive)。

抽取式,顾名思义,即从原文中抽取出能最大程度上保留原文信息的一个或多个句子,并将其组合成一段话,作为原文的摘要。这种方法所形成的摘要一般无语法问题,但多个句子间的衔接往往并不顺畅。此外,部分文章的关键信息较为分散,并不集中在几个句子中,故有时候得到的摘要质量较差,不过整体来说差强人意。生成式方法,与人类做摘要的方式较为接近,即先阅读原文,然后根据自己的理解写摘要。对于计算机来说,即先将原文编码成数字形式,然后根据编码信息来进行解码,使用语言模型来生产摘要。当前的各类生成式方法能生成效果较好的摘要,但其无论是在模型训练阶段还是生成摘要阶段,效率都十分的低下,尤其是在输入序列较长时,其时间消耗和空间消耗十分巨大。

发明内容

本发明提供一种高效、准确的基于自注意力的生成式文本摘要方法。

为了达到上述技术效果,本发明的技术方案如下:

一种基于自注意力的生成式文本摘要方法,包括以下步骤:

S1:建立基于自注意力机制的文本摘要模型,模型包括基于自注意力机制的编码器和基于注意力机制的解码器,其中编码器的参数被解码器共享;

S2:建立文本摘要模型的对应的损失函数;

S3:进行文本摘要模型的训练,并在目标文本数据集上测试。

进一步地,所述步骤S1的具体过程是:

S11:构建字词的向量表示层:先将文字转换成数字表示,即用向量表示层来完成;

S12:构建基于自注意力机制的编码器,编码器包括多头注意力层和全连接层,接收来自于向量表示层的向量,并提取其中隐藏的特征,以向量形式输出;

S13:构建基于注意力机制的解码器,解码器包括多头注意力层和全连接层,接收来自于编码器的特征,并根据此特征来生成摘要文本。

进一步地,所述步骤S2的具体过程是:

文本摘要模型的损失函数由负对数似然函数给出:

loss=-logP(y|x)

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910511656.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top