[发明专利]模型训练方法、装置、设备及存储介质在审
| 申请号: | 202110975270.4 | 申请日: | 2021-08-24 |
| 公开(公告)号: | CN114332469A | 公开(公告)日: | 2022-04-12 |
| 发明(设计)人: | 刘松涛;李蓝青 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06V10/40 | 分类号: | G06V10/40;G06V10/774;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08;G06N20/00 |
| 代理公司: | 北京励诚知识产权代理有限公司 11647 | 代理人: | 赵爽 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 模型 训练 方法 装置 设备 存储 介质 | ||
1.一种模型训练方法,其特征在于,包括:
获取第一训练图数据和N组超参,所述第一训练图数据包括R个数据对,每个数据对由图网络中的一个中心节点的第一特征信息和所述中心节点的一个邻居图节点的第一特征信息组成,所述N、R均为正整数;
将所述第一训练图数据分别输入所述N组超参中每一组超参下的生成器中,以使所述生成器学习在给定中心节点的特征条件下所述中心节点的邻居节点的特征概率分布,得到所述N组超参中每一组超参下训练后的生成器;
从N组超参下训练后的生成器中,确定出目标生成器,所述目标生成器用于生成第二抽样样本,所述第二抽样样本用于训练预设的图神经网络模型。
2.根据权利要求1所述的方法,其特征在于,所述从N组超参下训练后的生成器中,确定出目标生成器,包括:
针对所述N组超参中的每一组超参,使用该组超参下训练后的生成器进行抽样,得到该组超参下训练后的生成器输出的第一抽样样本,并使用该组超参下训练后的生成器输出的第一抽样样本,对预设的第一预测模型进行训练,得到该组超参对应的训练后的第一预测模型;
分别确定每一组超参对应的训练后的第一预测模型的预测准确度;
将预测准确度最高的第一预测模型所对应的一组超参下训练后的生成器,确定为所述目标生成器。
3.根据权利要求1所述的方法,其特征在于,所述将所述第一训练图数据分别输入所述N组超参中每一组超参下的生成器中,以使所述生成器学习在给定中心节点的特征条件下所述中心节点的邻居节点的特征概率分布,得到所述N组超参中每一组超参下训练后的生成器,包括:
针对所述N组超参中的每一组超参下的生成器,根据预设的批batch大小,从所述第一训练图数据中获取第i个batch,所述第i个batch包括至少一个数据对,所述i为从1到M的正整数,所述M为预设的生成器的训练次数;
使用所述第i个batch对该组超参下的生成器进行训练,以使所述生成器学习在给定所述第i个batch中的各中心节点的特征条件下各中心节点的邻居节点的特征概率分布,得到所述第i个batch训练后的生成器;
使用所述第i个batch训练后的生成器进行抽样,得到所述生成器输出的所述第i个batch对应的第三抽样样本;
将所述第i个batch对应的第三抽样样本输入预设的第二预测模型中,得到所述第二预测模型输出的所述第i个batch对应的预测结果;
根据所述第二预测模型输出的所述第i个batch对应的预测结果,确定所述第i个batch对应的不确定性分数;
将M个batch对应的不确定分数中最高不确定分数对应的batch所训练后的生成器,确定为该组超参下训练后的生成器。
4.根据权利要求3所述的方法,其特征在于,所述生成器为条件变分自编码器,所述条件变分自编码器包括编码模块和解码模块,所述使用第i个batch对该组超参下的生成器进行训练,以使所述生成器学习在给定所述第i个batch中的中心节点的特征条件下所述中心节点的邻居节点的特征概率分布,得到所述第i个batch训练后的生成器,包括:
针对所述第i个batch中的每一个数据对,将所述数据对输入所述编码模块中,得到所述编码模块输出的第一方差和第一均值;
将所述第一方差和所述第一均值通过重参数化技巧转换为第一隐变量,并将所述第一隐变量与所述数据对中的中心节点的第一特征信息,输入所述解码模块中,得到所述解码模块输出的增广特征向量;
使用所述增广特征向量对所述编码模块和所述解码模块进行训练,得到所述第i个batch训练后的所述编码模块和所述解码模块。
5.根据权利要求4所述的方法,其特征在于,所述使用所述第i个batch训练后的生成器进行抽样,得到所述生成器输出的第三抽样样本,包括:
选取K个节点的第一特征信息,所述K为正整数;
为所述K个节点中的每一个节点随机选取一个第二方差和第二均值;
针对所述K个节点中的每一个节点,将所述节点对应的第二方差和第二均值通过重参数化技巧转换为第二隐变量,并将所述第二隐变量与所述节点的第一特征信息输入所述第i个batch训练后的所述解码模块中,得到所述解码模块输出的第三抽样样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110975270.4/1.html,转载请声明来源钻瓜专利网。





