[发明专利]文本摘要模型的训练方法及装置在审
| 申请号: | 202210374234.7 | 申请日: | 2022-04-11 |
| 公开(公告)号: | CN114861640A | 公开(公告)日: | 2022-08-05 |
| 发明(设计)人: | 张琳涵;陈谦;邓憧;王雯 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
| 主分类号: | G06F40/258 | 分类号: | G06F40/258;G06F40/205;G06F16/35;G06K9/62 |
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 谭镇 |
| 地址: | 310012 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 摘要 模型 训练 方法 装置 | ||
本申请实施例提供了一种文本摘要模型的训练方法及装置,包括:获取训练数据集,训练数据集包括:至少一个标注摘要样本,标注摘要样本关联有至少一个相关文本样本;从标注摘要样本中获取至少一个关键句子,并在与标注摘要样本关联的相关文本样本中,获取与关键句子匹配的相似句子;利用关键句子与相似句子的对应关系训练初始文本摘要模型,获得第一文本摘要模型;利用标注摘要样本与相关文本样本的对应关系训练第一文本摘要模型,获得第二文本摘要模型。本申请采用输入多个相似句子的训练方式,可以较大幅度的降低模型的输入量,从而减少计算量,另外,由于关键句子和相似句子的提取减少了其他冗余内容带来的干扰,因此也提高了整体的训练效率。
技术领域
本申请涉及计算机技术领域,特别是涉及一种文本摘要模型的训练方法、文本摘要的获取方法及装置、电子设备、机器可读介质。
背景技术
多文本摘要是一种归纳总结多篇文本的核心内容的技术,能够有效提高对文本的处理能力。
相关技术中,在多文本摘要场景的模型训练过程中,需要构建不同训练文本之间的语义关系图,来帮助模型学习多文本之间摘要的逻辑关系。
但是,发明人经过研究发现,目前的方案中,构建语义关系图需要耗费较多计算资源、时间以及人工标注成本,导致训练效率低下。
发明内容
本申请实施例提供了一种文本摘要模型的训练方法及文本摘要的获取方法,以解决相关技术中训练效率低下的问题。
相应的,本申请实施例还提供了一种文本摘要模型的训练装置及文本摘要的获取装置、电子设备以及存储介质,用以保证上述方法的实现及应用。
为了解决上述问题,本申请实施例公开了一种文本摘要模型的训练方法,所述方法包括:
获取训练数据集,所述训练数据集包括:至少一个标注摘要样本,所述标注摘要样本关联有至少一个相关文本样本;
从所述标注摘要样本中获取至少一个关键句子,并在与所述标注摘要样本关联的相关文本样本中,获取与所述关键句子匹配的相似句子;
利用所述关键句子与所述相似句子的对应关系训练初始文本摘要模型,获得第一文本摘要模型;
利用所述标注摘要样本与所述相关文本样本的对应关系训练第一文本摘要模型,获得第二文本摘要模型,所述第二文本摘要模型用于根据至少一个相关文本生成摘要文本。
可选的,还包括:
将至少一个相关文本拼接后输入所述第二文本摘要模型,获得所述第二文本摘要模型输出的摘要文本。
可选的,在所述训练数据集中,所述标注摘要样本关联的至少一个相关文本样本各自的所属领域不同。
本申请实施例公开了一种文本摘要的获取方法,包括:
获取至少一个待处理文本;
将所述待处理文本输入第二文本摘要模型,获得所述第二文本摘要模型输出的摘要文本,其中,所述第二文本摘要模型由所述的文本摘要模型的训练方法训练获得。
本申请实施例公开了一种文本摘要模型的训练装置,所述装置包括:
第一获取模块,用于获取训练数据集,所述训练数据集包括:至少一个标注摘要样本,所述标注摘要样本关联有至少一个相关文本样本;
第二获取模块,用于从所述标注摘要样本中获取至少一个关键句子,并在与所述标注摘要样本关联的相关文本样本中,获取与所述关键句子匹配的相似句子;
第一训练模块,用于利用所述关键句子与所述相似句子的对应关系训练初始文本摘要模型,获得第一文本摘要模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210374234.7/2.html,转载请声明来源钻瓜专利网。





