[发明专利]一种文本摘要生成方法和装置有效
| 申请号: | 202010550450.3 | 申请日: | 2020-06-16 |
| 公开(公告)号: | CN111797225B | 公开(公告)日: | 2023-08-22 |
| 发明(设计)人: | 叶蔚;张世琨;刘学洋;胡天翔;张君福 | 申请(专利权)人: | 北京北大软件工程股份有限公司 |
| 主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F40/284;G06N3/0464;G06N3/0442;G06N3/049;G06N3/08 |
| 代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 岳凤羽 |
| 地址: | 100089 北京市海淀区北四环西路67号中关*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 文本 摘要 生成 方法 装置 | ||
1.一种文本摘要生成方法,其特征在于,包括:
获取输入文本;
采用编码器对所述文本进行处理得到编码器的环境向量,所述编码器包括具有感知关键词注意力机制网络的合并层;
根据所述编码器的环境向量采用解码器解码生成摘要;
所述获取输入文本还包括:
将所述文本进行分词;
通过预训练的词向量矩阵将分词后的文本转换为低维实值向量形式的第一文本序列;
编码器对所述文本进行处理得到编码器的环境向量包括:
将所述第一文本序列进行编码得到编码器隐向量;
通过具有感知关键词注意力机制网络的合并层对所述编码器隐向量进行权重调整得到第二文本序列;
再次通过两层的双向长短时记忆循环神经网络对所述第二文本序列进行调整,得到所述编码器的环境向量;
所述通过具有感知关键词注意力机制网络的合并层对所述编码器隐向量进行权重调整得到第二文本序列包括:
获取所述文本的关键词向量;
根据所述编码器隐向量与所述关键词向量生成每个编码器隐向量对应的关键词环境向量;
根据所述编码器隐向量和所述关键词环境向量计算得到第二文本序列;
所述根据所述编码器隐向量和所述关键词环境向量计算得到第二文本序列包括:
根据所述编码器隐向量计算得到合并参数和选择参数;
通过合并参数合并所述编码器隐向量和所述关键词环境向量;
将合并后的向量乘以选择参数得到第二文本序列。
2.根据权利要求1所述的方法,其特征在于:所述将所述第一文本序列进行编码得到编码器隐向量包括:
将所述第一文本序列输入到两层的双向长短时记忆循环神经网络;
在所述两层的双向长短时记忆循环神经网络中,获取所述第一文本序列中词语的两侧的词的信息;
将所述两侧的词的信息与所述词语本身信息进行计算;
根据计算结果对所述词语信息进行操作,所述操作包括保留、记忆以及删除;
对所述第一文本序列中的所有词语进行操作后得到编码器隐向量。
3.根据权利要求1所述的方法,其特征在于:所述获取所述文本的关键词向量包括:
对所述文本进行分词;
通过TF-IDF技术对分词后的文本进行排序;
选取排序在预设数值内的词语作为所述文本的关键词;
将所述关键词按照在所述文本中出现的先后顺序组成第一关键词序列;
将所述第一关键词序列通过预设的词向量矩阵转换为低维实值向量形式的第二关键词序列;
将所述第二关键词序列通过两层的双向长短时记忆循环神经网络得到所述文本的关键词向量。
4.根据权利要求1所述的方法,其特征在于:所述根据所述编码器隐向量与所述关键词向量生成每个编码器隐向量对应的关键词环境向量包括:
根据注意力机制计算所述编码器隐向量与所述关键词向量的关联性;
将计算出的所述关联性作为权重得到每个编码器隐向量对应的关键词环境向量。
5.根据权利要求1所述的方法,其特征在于:所述根据所述编码器的环境向量采用解码器解码生成摘要包括以下步骤:
当不是初次解码时,通过一个两层的单向长短时记忆网络生成解码向量;当初次解码时,根据所述编码器环境向量计算得到解码向量;
根据所述解码向量和所述编码器的环境向量基于注意力机制计算得到解码器环境向量;
根据所述解码器环境向量与所述解码向量生成解码平均向量;
根据所述解码平均向量生成输出每个词的概率;
根据所述概率通过Beam Search算法得到解码的词;
将得到的所述解码的词、解码向量以及解码平均向量作为输入数据输入到所述两层的单向长短时记忆网络中,重复上述步骤直至解码完成;
将每次得到的解码的词按顺序生成摘要。
6.一种文本摘要生成装置,其特征在于,包括:
文本获取模块,用于获取输入文本;所述获取输入文本还包括:将所述文本进行分词;通过预训练的词向量矩阵将分词后的文本转换为低维实值向量形式的第一文本序列;
编码模块,用于采用编码器对所述文本进行处理得到编码器的环境向量,所述编码器包括具有感知关键词注意力机制网络的合并层;编码器对所述文本进行处理得到编码器的环境向量包括:将所述第一文本序列进行编码得到编码器隐向量;通过具有感知关键词注意力机制网络的合并层对所述编码器隐向量进行权重调整得到第二文本序列;再次通过两层的双向长短时记忆循环神经网络对所述第二文本序列进行调整,得到所述编码器的环境向量;
所述通过具有感知关键词注意力机制网络的合并层对所述编码器隐向量进行权重调整得到第二文本序列包括:获取所述文本的关键词向量;根据所述编码器隐向量与所述关键词向量生成每个编码器隐向量对应的关键词环境向量;根据所述编码器隐向量和所述关键词环境向量计算得到第二文本序列;
解码模块,用于根据所述编码器的环境向量采用解码器解码生成摘要;所述根据所述编码器隐向量和所述关键词环境向量计算得到第二文本序列包括:根据所述编码器隐向量计算得到合并参数和选择参数;通过合并参数合并所述编码器隐向量和所述关键词环境向量;将合并后的向量乘以选择参数得到第二文本序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京北大软件工程股份有限公司,未经北京北大软件工程股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010550450.3/1.html,转载请声明来源钻瓜专利网。





