[发明专利]摘要文本生成方法、装置和计算机设备有效
| 申请号: | 201810312755.3 | 申请日: | 2018-04-09 |
| 公开(公告)号: | CN108427771B | 公开(公告)日: | 2020-11-10 |
| 发明(设计)人: | 王励;姚均霖;钟黎;陶蕴哲 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06F16/00 | 分类号: | G06F16/00;G06F30/27 |
| 代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 李文渊;邓云鹏 |
| 地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 摘要 文本 生成 方法 装置 计算机 设备 | ||
本申请涉及一种摘要文本生成方法、装置和计算机设备,方法包括:获取原始文本的词序列;通过机器学习模型的第一通道和第二通道,分别对词序列各自进行编码和解码,且在解码时参考机器学习模型前一时刻所输出摘要词的词向量,从而得到当前时刻的第一隐层状态向量和第二隐层状态向量,进而根据当前时刻的第一隐层状态向量和第二隐层状态向量确定机器学习模型当前时刻输出的摘要词;根据机器学习模型所输出的各摘要词生成摘要文本。本申请提供的方案可以实现提升生成的摘要文本的可读性。
技术领域
本申请涉及计算机技术领域,特别是涉及一种摘要文本生成方法、装置和 计算机设备。
背景技术
自动摘要文本在许多NLP(Natural Language Processing,自然语言处理)领 域中有着非常重要的应用。如新闻标题生成、会议纪要、社交短文本的话题生 成、智能客服任务等等。如何生成可读性强的摘要文本变成了炙手可热的研究 课题。
目前,为了自动生成摘要文本,通常采用的是将文本序列输入基于RNN(Recurrent neural networks,循环神经网络)的机器学习模型,经过计算或变换 后输出得到摘要文本序列。然而,这种方式生成的摘要文本存在可读性差的问 题。
发明内容
基于此,有必要针对目前采用的方式所生成的摘要文本可读性差的问题, 提供一种摘要文本生成方法、装置、计算机可读存储介质和计算机设备。
一种摘要文本生成方法,包括:
获取原始文本的词序列;
通过预训练的机器学习模型中第一通道的编码器,对所述词序列进行语义 相关编码,得到所述词序列中各词对应的语义编码向量;
通过所述机器学习模型中第二通道的编码器,对所述词序列进行主题相关 编码,得到所述词序列中各词对应的主题编码向量;
通过所述第一通道的解码器,根据所述机器学习模型前一时刻所输出摘要 词的词向量对所述语义编码向量解码,得到当前时刻的第一隐层状态向量;
通过所述第二通道的解码器,根据所述机器学习模型前一时刻所输出摘要 词的词向量对所述主题编码向量解码,得到当前时刻的第二隐层状态向量;
根据当前时刻的第一隐层状态向量和第二隐层状态向量,确定所述机器学 习模型当前时刻输出的摘要词;
根据所述机器学习模型所输出的各摘要词生成摘要文本。
一种摘要文本生成装置,包括:
获取模块,用于获取原始文本的词序列;
第一编码模块,用于通过预训练的机器学习模型中第一通道的编码器,对 所述词序列进行语义相关编码,得到所述词序列中各词对应的语义编码向量;
第二编码模块,用于通过所述机器学习模型中第二通道的编码器,对所述 词序列进行主题相关编码,得到所述词序列中各词对应的主题编码向量;
第一解码模块,用于通过所述第一通道的解码器,根据所述机器学习模型 前一时刻所输出摘要词的词向量对所述语义编码向量解码,得到当前时刻的第 一隐层状态向量;
第二解码模块,用于通过所述第二通道的解码器,根据所述机器学习模型 前一时刻所输出摘要词的词向量对所述主题编码向量解码,得到当前时刻的第 二隐层状态向量;
确定模块,用于根据当前时刻的第一隐层状态向量和第二隐层状态向量, 确定所述机器学习模型当前时刻输出的摘要词;
生成模块,根据所述机器学习模型所输出的各摘要词生成摘要文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810312755.3/2.html,转载请声明来源钻瓜专利网。





