[发明专利]文本生成方法和设备在审
| 申请号: | 201911417700.X | 申请日: | 2019-12-31 |
| 公开(公告)号: | CN113128180A | 公开(公告)日: | 2021-07-16 |
| 发明(设计)人: | 翁荣祥;魏浩然;于恒;骆卫华 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06F40/166 | 分类号: | G06F40/166;G06F16/34;G06F40/58;G06F40/126;G06N3/04 |
| 代理公司: | 北京博雅睿泉专利代理事务所(特殊普通合伙) 11442 | 代理人: | 郭少晶 |
| 地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 生成 方法 设备 | ||
1.一种文本生成方法,其特征在于,包括以下步骤:
将源文本输入至编码器中,得到编码器的隐藏层输出的特征向量;
从编码器的隐藏层输出的特征向量中抽取出源文本的全局状态;
将编码器最终输出的特征向量和源文本的全局状态输入至解码器中,生成目标文本。
2.根据权利要求1所述的方法,通过卷积神经网络或者胶囊网络从编码器的隐藏层输出的特征向量中抽取出源文本的全局状态。
3.根据权利要求1所述的方法,所述编码器采用循环神经网络或者卷积神经网络实现;所述解码器采用循环神经网络或者卷积神经网络实现。
4.根据权利要求2所述的方法,所述编码器包括M个隐藏层,M为整数并且M≥1;
所述通过胶囊网络从编码器的隐藏层输出的特征向量中抽取出源文本的全局状态,包括:
将编码器的隐藏层输出的特征向量输入至胶囊网络中,得到该隐藏层对应的全局状态;
根据M个隐藏层对应的全局状态确定源文本的全局状态。
5.根据权利要求4所述的方法,所述根据M个隐藏层对应的全局状态确定源文本的全局状态,包括:
对M个隐藏层对应的全局状态进行平均处理,将平均处理的结果作为源文本的全局状态。
6.根据权利要求4所述的方法,所述将编码器的隐藏层输出的特征向量输入至胶囊网络中,得到该隐藏层对应的全局状态,包括:
将编码器的隐藏层输出的特征向量输入至具有K个胶囊的胶囊网络中,得到该隐藏层对应的K个胶囊矩阵,其中K为整数并且K≥2;
对该隐藏层对应的K个胶囊矩阵进行融合,得到该隐藏层对应的全局状态。
7.根据权利要求6所述的方法,所述将编码器的隐藏层输出的特征向量输入至具有K个胶囊的胶囊网络中,得到该隐藏层对应的K个胶囊矩阵,包括:
将编码器的隐藏层输出的特征向量输入至具有K个胶囊的胶囊网络中,得到该隐藏层对应的K个初级胶囊矩阵;
使用动态路由算法对该隐藏层对应的K个初级胶囊矩阵进行迭代更新,得到该隐藏层对应的K个胶囊矩阵。
8.根据权利要求6所述的方法,所述对该隐藏层对应的K个胶囊矩阵进行融合,得到该隐藏层对应的全局状态,包括:
计算所述K个胶囊矩阵的平均矩阵;
根据所述平均矩阵,计算所述K个胶囊矩阵中的每个胶囊矩阵的权重;
通过对所述K个胶囊矩阵进行加权求和,得到该隐藏层对应的全局状态。
9.根据权利要求6所述的方法,使用基于注意力机制的池化算法、或者平均池化算法、或者最大池化算法实现所述融合。
10.根据权利要求1所述的方法,所述将编码器最终输出的特征向量和源文本的全局状态输入至解码器中,生成目标文本,包括:
利用源文本的全局状态,对解码器的最后一个隐藏层输出的特征向量进行动态调节;
基于调节后的特征向量生成目标文本。
11.根据权利要求10所述的方法,所述利用源文本的全局状态对解码器的最后一个隐藏层输出的特征向量进行动态调节,包括:
根据解码器的最后一个隐藏层在当前解码时间步输出的特征向量和源文本的全局状态的相关程度,确定源文本的全局状态在当前解码时间步的权重;
计算源文本的全局状态与源文本的全局状态在当前解码时间步的权重的乘积;
计算解码器的最后一个隐藏层在当前解码时间步输出的特征向量和所述乘积的和值,将所述和值作为解码器的最后一个隐藏层在当前解码时间步最终输出的特征向量。
12.根据权利要求1所述的方法,所述解码器用于生成摘要,所述目标文本是摘要;或者,
所述解码器用于进行语言转换,所述目标文本是与源文本对应的另一种语言的文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911417700.X/1.html,转载请声明来源钻瓜专利网。





