[发明专利]篇章主题分段模型训练方法、电子设备和存储介质在审
申请号: | 202111657764.4 | 申请日: | 2021-12-30 |
公开(公告)号: | CN114328928A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 张益凡 | 申请(专利权)人: | 思必驰科技股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/31;G06F40/289;G06N3/04 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;邓婷婷 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 篇章 主题 分段 模型 训练 方法 电子设备 存储 介质 | ||
1.一种篇章主题分段模型训练方法,其中,所述篇章主题分段模型包括分段任务和分类任务,所述分段任务包括使用序列标注模型,所述方法包括:
在所述分段任务中采用指针网络替代所述序列标注模型中的crf层;
在所述分类任务中结合所述指针网络生成的索引值进行文本分类。
2.根据权利要求1所述的方法,其中,所述序列标注模型包括编码器模块和解码器模块,所述分段任务的基本框架为所述序列标注模型中的编码器模块,所述在所述分段任务中采用指针网络替代所述序列标注模型中的crf层包括:
基于指针网络将所述编码器模块的隐层输出与所述解码器模块的输出进行注意力机制处理;
根据所述注意力机制层中得分最高的节点位置确定文档分段点。
3.根据权利要求2所述的方法,其中,所述在所述分类任务中结合所述指针网络生成的索引值进行文本的合并和分类包括:
根据分段任务的分段点取原始句向量矩阵和编码器模块的隐层输出中对应的元素,通过拼接和池化的方式生成解码器模块下一个时间步的输入,不断生成所述解码器模块各时间步的输入,每一个所述输入包括每一个主题段落的特征信息。
4.根据权利要求3所述的方法,还包括:
基于所述分段任务确定的文档分段点与原始标签对比得到分段任务的分段损失函数;
基于所述分类任务确定的对于各个类别的概率分布计算所述分类过程中产生的分类损失函数;
基于所述分段损失函数和所述分类损失函数形成多任务损失函数;
基于所述多任务损失函数对所述篇章主题分段模型进行参数的更新。
5.根据权利要求1所述的方法,在所述分段任务之前,所述方法还包括:
对训练数据进行分词和词向量生成;
基于生成的词向量进行句向量生成。
6.根据权利要求5所述的方法,其中,所述基于生成的词向量进行句向量生成包括使用句向量生成模型生成句向量,所述句向量生成模型包括BiLSTM模型。
7.根据权利要求6所述的方法,还包括:
将所述句向量生成模型与所述分段任务、所述分类任务进行联合训练,以同时优化各模型的模型参数。
8.一种篇章主题分段系统,包括:
分词和词向量生成模型,用于对对训练数据进行分词和词向量生成;
句向量生成模型,用于基于生成的词向量进行句向量生成;
分段模型,用于根据权利要求1-7中任一项所述的方法对所述句向量进行分段;以及
分类模型,用于根据权利要求1-7中任一项所述的方法基于分段的结果进行分类。
9.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至8任一项所述方法的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至8任一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111657764.4/1.html,转载请声明来源钻瓜专利网。