[发明专利]一种获取文本摘要的方法及语言模型生成方法在审

专利信息
申请号: 202010318584.2 申请日: 2020-04-21
公开(公告)号: CN111581341A 公开(公告)日: 2020-08-25
发明(设计)人: 陈栋;付骁弈;张杰 申请(专利权)人: 上海明略人工智能(集团)有限公司
主分类号: G06F16/33 分类号: G06F16/33;G06F16/34;G06F40/211
代理公司: 北京安信方达知识产权代理有限公司 11262 代理人: 王康;龙洪
地址: 200232 上海市徐*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 获取 文本 摘要 方法 语言 模型 生成
【权利要求书】:

1.一种语言模型生成方法,包括:

对分句排列顺序调整的训练文本,按照预设生成策略生成各分句的语句特征向量;

通过预设的特征抽取器对生成的各分句的语句特征向量进行处理,获得各分句的输出向量;

根据获得的所有分句的输出向量,确定排列顺序调整后的分句的语句排列顺序信息;

根据标准排序信息和确定的语句排序信息,对特征提取器进行参数调整,以获得用于向量表达的语言模型;

其中,所述语句特征向量包括:字嵌入的特征信息、区分各相邻分句的特征信息和标识分句内词语排序的特征信息;所述标准排序信息包括:对未调整分句排列顺序的训练文本的各分句按序分别添加编号;根据添加的所有分句的编号,生成未调整分句排列顺序的训练文本的编号排序信息;语句排序信息包括:基于添加的各分句的编号生成的:分句排列调整后训练文本的所有分句的编号排序信息。

2.根据权利要求1所述的语言模型生成方法,其特征在于,所述按预设生成策略生成各分句的语句特征向量,包括:

对分句排列顺序调整的所述训练文本的各分句分别添加预设的起止标识;

对添加所述起止标识的各分句分别进行嵌入处理;

根据各分句的嵌入处理结果获得各分句的所述语句特征向量;

其中,所述起止标识包括:起始标识和终止标识。

3.根据权利要求2所述的语言模型生成方法,其特征在于,所述对添加所述起止标识的各分句分别进行嵌入处理,包括:

对添加起止标识的分句进行字嵌入;

对添加起止标识的分句,按照预设的分句区分标识进行段嵌入;

对添加起止标识的分句,按照预设的句内词语排序标识对分句内的词语进行语句内位置嵌入;

其中,所述分句区分标识包括:用于区分相邻分句的标识,同一分句内的词语的分句区分标识相同;所述句内词语排序标识包括:用于区分分句内各词语排列顺序的标识。

4.根据权利要求3所述的语言模型生成方法,其特征在于,所述根据各分句的嵌入处理结果获得各分句的所述语句特征向量,包括:

对每一个分句的所述字嵌入、所述段嵌入和所述语句内位置嵌入的结果进行累加,获得各分句的所述语句特征向量。

5.根据权利要求2~4任一项所述的语言模型生成方法,其特征在于,所述确定排序调整后的分句的语句排序信息,包括:

对获得的所有分句的所述输出向量中的起始标识进行掩码处理;

通过预设解码器对所述掩码处理后的输出向量进行解码,获得所述语句排序信息;

其中,所述解码器包括:指针网络解码器。

6.根据权利要求1~4任一项所述的语言模型生成方法,其特征在于,所述对特征提取器进行参数调整,包括:

根据标准排序信息和确定的语句排序信息的损失和梯度信息,通过反向传播对所述特征提取器进行参数调整;

调整所述特征提取器的参数,判断出所述标准排序信息和所述语句排序信息的损失值出现最小值且持续预设个周期最小值不变时,将该特征提取器作为所述用于向量表达的语言模型。

7.一种获取文本摘要的方法,包括:

根据预先生成的语言模型对待处理文本的各分句进行向量表达;

根据各分句的向量表达,计算待处理文本中各分句的权重;

根据计算获得的各分句的权重,对待处理文本中进行语句抽取,以获得文本摘要。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海明略人工智能(集团)有限公司,未经上海明略人工智能(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010318584.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top