[发明专利]文本生成方法和设备在审
| 申请号: | 201911417700.X | 申请日: | 2019-12-31 |
| 公开(公告)号: | CN113128180A | 公开(公告)日: | 2021-07-16 |
| 发明(设计)人: | 翁荣祥;魏浩然;于恒;骆卫华 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06F40/166 | 分类号: | G06F40/166;G06F16/34;G06F40/58;G06F40/126;G06N3/04 |
| 代理公司: | 北京博雅睿泉专利代理事务所(特殊普通合伙) 11442 | 代理人: | 郭少晶 |
| 地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 生成 方法 设备 | ||
本发明涉及文本生成方法、文本生成设备、新闻摘要生成方法、机器翻译方法、提供文本生成服务的方法、计算机可读存储介质。所述方法包括:将源文本输入至编码器中,得到编码器的隐藏层输出的特征向量;从编码器的隐藏层输出的特征向量中抽取出源文本的全局状态;将编码器最终输出的特征向量和源文本的全局状态输入至解码器中,生成目标文本。本发明提供的文本生成方法,将全局状态融入到文本生成的过程中,能够提升文本生成的准确性。
技术领域
本说明书涉及语言处理技术,更具体地,涉及文本生成方法、文本生成设备、新闻摘要生成方法、机器翻译方法、提供文本生成服务的方法、计算机可读存储介质。
背景技术
文本自动生成是机器学习在语言处理领域的一个重要研究方向,文本生成的应用在日常生活中十分广泛,例如机器翻译、智能问答、文本摘要等。在文本生成过程中,需要准确捕捉源文本的语义,才能够准确生成对应的目标文本。目前的文本生成技术主要是基于神经网络实现,关注词到词的映射,生成的目标文本准确度无法满足需求。
发明内容
本说明书公开的实施例提供一种文本生成的方案。
根据本发明公开的第一方面,提供了文本生成方法,包括以下步骤:
将源文本输入至编码器中,得到编码器的隐藏层输出的特征向量;
从编码器的隐藏层输出的特征向量中抽取出源文本的全局状态;
将编码器最终输出的特征向量和源文本的全局状态输入至解码器中,生成目标文本。
可选地,通过卷积神经网络或者胶囊网络从编码器的隐藏层输出的特征向量中抽取出源文本的全局状态。
可选地,所述编码器采用循环神经网络或者卷积神经网络实现;所述解码器采用循环神经网络或者卷积神经网络实现。
可选地,所述编码器包括M个隐藏层,M为整数并且M≥1;所述通过胶囊网络从编码器的隐藏层输出的特征向量中抽取出源文本的全局状态,包括:
将编码器的隐藏层输出的特征向量输入至胶囊网络中,得到该隐藏层对应的全局状态;
根据M个隐藏层对应的全局状态确定源文本的全局状态。
可选地,所述根据M个隐藏层对应的全局状态确定源文本的全局状态,包括:
对M个隐藏层对应的全局状态进行平均处理,将平均处理的结果作为源文本的全局状态。
可选地,所述将编码器的隐藏层输出的特征向量输入至胶囊网络中,得到该隐藏层对应的全局状态,包括:
将编码器的隐藏层输出的特征向量输入至具有K个胶囊的胶囊网络中,得到该隐藏层对应的K个胶囊矩阵,其中K为整数并且K≥2;
对该隐藏层对应的K个胶囊矩阵进行融合,得到该隐藏层对应的全局状态。
可选地,所述将编码器的隐藏层输出的特征向量输入至具有K个胶囊的胶囊网络中,得到该隐藏层对应的K个胶囊矩阵,包括:
将编码器的隐藏层输出的特征向量输入至具有K个胶囊的胶囊网络中,得到该隐藏层对应的K个初级胶囊矩阵;
使用动态路由算法对该隐藏层对应的K个初级胶囊矩阵进行迭代更新,得到该隐藏层对应的K个胶囊矩阵。
可选地,所述对该隐藏层对应的K个胶囊矩阵进行融合,得到该隐藏层对应的全局状态,包括:
计算所述K个胶囊矩阵的平均矩阵;
根据所述平均矩阵,计算所述K个胶囊矩阵中的每个胶囊矩阵的权重;
通过对所述K个胶囊矩阵进行加权求和,得到该隐藏层对应的全局状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911417700.X/2.html,转载请声明来源钻瓜专利网。





