[发明专利]生成摘要的方法和装置有效
| 申请号: | 202010305488.4 | 申请日: | 2020-04-17 |
| 公开(公告)号: | CN111506725B | 公开(公告)日: | 2021-06-22 |
| 发明(设计)人: | 李伟;肖欣延 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F40/126;G06F40/186;G06F40/30 |
| 代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 生成 摘要 方法 装置 | ||
1.一种生成摘要的方法,所述方法包括:
基于对文档集中的各条语句进行编码所得到的各条语句中各个词的上下文向量表示,确定所述文档集的各条语句的初始输入向量表示;
基于所述文档集中的各条语句之间的语义关系,构造所述文档集的结构化关系图;
基于所述结构化关系图,对所述各条语句的初始输入向量表示进行上下文编码,得到各条语句的上下文向量表示;
基于所述各条语句的初始输入向量表示、所述结构化关系图和所述各条语句的上下文向量表示,解码得到所述文档集的摘要文本,包括:将所述各条语句的初始输入向量表示、所述结构化关系图和所述各条语句的上下文向量表示输入解码器,以使所述解码器将所述结构化关系图作为所述各条语句的初始输入向量表示、所述各条语句的上下文向量表示的约束,解码得到所述文档集的摘要文本。
2.根据权利要求1所述的方法,其中,所述基于所述结构化关系图,对所述各条语句的初始输入向量表示进行上下文编码,得到各条语句的上下文向量表示,包括:
基于所述结构化关系图,确定编码器的上下文注意力模型的注意力系数的权重;
基于所述上下文注意力模型的注意力系数的权重,对所述各条语句的初始输入向量表示进行编码,得到各条语句的上下文向量表示。
3.根据权利要求2所述的方法,其中,所述基于所述结构化关系图,确定编码器的上下文注意力模型中的注意力系数的权重,包括:
采用高斯函数将所述结构化关系图中各条语句之间的语义关系转换为编码器的上下文注意力模型中的注意力系数的权重;以及
所述基于所述上下文注意力模型的注意力系数的权重,对所述各条语句的初始输入向量表示进行编码,得到各条语句的上下文向量表示,包括:
采用所述注意力系数的权重,计算所述各条语句的初始输入向量表示和与该初始输入向量表示存在语义关系的初始输入向量表示的相关性的加权值,得到各条语句的上下文向量表示。
4.根据权利要求1所述的方法,其中,所述基于所述各条语句的初始输入向量表示、所述结构化关系图和所述各条语句的上下文向量表示,解码得到所述文档集的摘要文本,包括:
基于当前解码步骤的向量表示与所述各条语句的初始输入向量表示的相似度,确定局部词级注意力层的注意力系数;
采用所述结构化关系图,对所述局部词级注意力层的注意力系数进行加权约束,得到当前解码步骤的向量表示所对应的当前词与各条语句中各个词的词级上下文向量表示;
基于当前解码步骤的向量表示与所述各条语句的上下文向量表示的相似度,确定全局语句级注意力层的注意力系数;
采用所述结构化关系图,对所述全局语句级注意力层的注意力系数进行加权约束,得到当前解码步骤的向量表示所对应的当前词与所述各条语句的语句级上下文向量表示;
基于所述词级上下文向量表示和所述语句级上下文向量表示,确定当前解码步骤的向量表示所对应的当前词。
5.根据权利要求4所述的方法,其中,所述采用所述结构化关系图,对所述全局语句级注意力层的注意力系数进行加权约束,得到当前解码步骤的向量表示所对应的当前词与所有语句的语句级上下文向量表示,包括:
基于将当前解码步骤的向量表示与所述各条语句的上下文向量表示进行对齐的结果,确定当前解码步骤的向量表示所对应的所述文档集中的中心语句;
采用所述结构化关系图,确定所述中心语句与所述文档集中其它语句的语义关系;
基于所述中心语句与所述文档集中其它语句的语义关系,确定全局语句级注意力层的注意力系数的权重;
采用所述全局语句级注意力层的注意力系数的权重,对所述全局语句级注意力层的注意力系数进行加权约束,得到当前解码步骤的向量表示与所有语句的语句级上下文向量表示。
6.根据权利要求4所述的方法,其中,基于所述词级上下文向量表示和所述语句级上下文向量表示,确定当前解码步骤的向量表示所对应的当前词,包括:
融合所述词级上下文向量表示和所述语句级上下文向量表示,得到所述当前解码步骤的融合上下文向量表示;
确定所述当前解码步骤的融合上下文向量表示所对应的当前词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010305488.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据异地同步计划性数据恢复系统及方法
- 下一篇:一种发光器件及其制作方法





