[发明专利]全局预处理模型的训练方法、装置、电子设备及存储介质在审
申请号: | 202210090185.4 | 申请日: | 2022-01-25 |
公开(公告)号: | CN114492406A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 杜师帅;王若兰;张钧波;郑宇 | 申请(专利权)人: | 京东城市(北京)数字科技有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/205;G06K9/62;G06Q10/08 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 杜叶蕊;刘芳 |
地址: | 100086 北京市海淀区知*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 全局 预处理 模型 训练 方法 装置 电子设备 存储 介质 | ||
1.一种全局预处理模型的训练方法,其特征在于,包括:
第一终端获得第一训练数据集,并利用所述第一训练数据集中的语料训练数据对原始预处理模型进行训练,得到第一局部预处理模型;其中,所述第一训练数据集中包括来自第一物流地址数据源的语料训练数据;
获取第二终端发送的第二局部预处理模型的模型参数;其中,所述第二局部预处理模型是所述第二终端利用第二训练数据集对所述原始预处理模型进行训练得到的模型,所述第二训练数据集中包括来自第二物流地址数据源的语料训练数据;
所述第一终端利用所述第二局部预处理模型的模型参数对所述第一局部预处理模型进行参数聚合加权处理,得到全局预处理模型。
2.根据权利要求1所述的训练方法,其特征在于,所述第一终端获得第一训练数据集,包括:
所述第一终端获取来自第一物流地址数据源的各物流地址的文本语料数据;
对所述文本语料数据进行数据清洗和特征工程处理,得到所述第一训练数据集中的语料训练数据。
3.根据权利要求1所述的训练方法,其特征在于,所述利用所述第一训练数据集中的语料训练数据对原始预处理模型进行训练,得到第一局部预处理模型,包括:
对所述第一训练数据集中的语料训练数据进行向量化处理,得到字符向量;
利用所述字符向量对所述原始预处理模型进行训练直至所述原始预处理模型中的参数收敛,得到所述第一局部预处理模型。
4.根据权利要求1所述的训练方法,其特征在于,所述利用所述第二局部预处理模型的模型参数对所述第一局部预处理模型进行参数聚合加权处理,得到全局预处理模型,包括:
对所述第二局部预处理模型的模型参数进行解压缩处理,得到第二局部预处理模型的神经元节点分布以及所述第二局部预处理模型在每个神经元节点上的参数取值;
确定所述第一局部预处理模型的神经元节点分布和所述第二局部预处理模型的神经元节点分布之间的神经元节点之间的映射关系;
利用所述映射关系,根据所述第二局部预处理模型在各个神经元节点上的参数取值,对所述第一局部预处理模型中相应各神经元节点上的参数取值进行聚合加权处理,得到所述全局预处理模型。
5.根据权利要求1所述的训练方法,其特征在于,所述得到第一局部预处理模型之后,所述训练方法还包括:
所述第一终端确定所述第一局部预处理模型的神经元节点分布以及每个神经元节点上的参数取值,并将所述神经元节点分布以及每个神经元节点上的参数取值进行压缩处理,得到所述第一局部预处理模型的模型参数;
将所述第一局部预处理模型的模型参数发送至所述第二终端,以供所述第二终端根据利用所述第一局部预处理模型的模型参数对所述第二终端中的第二局部预处理模型进行参数聚合加权处理,得到所述全局预处理模型。
6.根据权利要求1所述的训练方法,其特征在于,所述训练方法还包括:
所述第一终端获得第一增量训练数据集,并利用所述第一增量训练数据集对当前的全局预处理模型进行增量训练,得到增量后的第一全局预处理模型;
其中,所述第一增量数据集中包括有第一语料增量训练数据,所述第一语料增量训练数据是对所述第一训练数据集中的语料训练数据进行数据增量处理所得到的数据。
7.根据权利要求6所述的训练方法,其特征在于,所述得到增量后的第一全局预处理模型之后,所述训练方法还包括:
确定增量前的全局预处理模型在每个神经元节点上的参数取值,和增量后的第一全局预处理模型在每个神经元节点上的参数取值之间的差值;
根据所述每个神经元节点上的参数取值之间的差值以及增量训练后的全局预处理模型的神经元节点分布进行压缩处理,得到所述增量后的第一全局预处理模型的模型参数;
将所述增量训练后的第一全局预处理模型的模型参数发送至所述第二终端,以供所述第二终端对根据所述增量后的第一全局预处理模型的模型参数对第二终端中的当前的全局预处理模型进行参数聚合加权处理,得到增量后的第一全局预处理模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东城市(北京)数字科技有限公司,未经京东城市(北京)数字科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210090185.4/1.html,转载请声明来源钻瓜专利网。