[发明专利]模型训练方法、装置、设备及存储介质在审
| 申请号: | 202110975270.4 | 申请日: | 2021-08-24 | 
| 公开(公告)号: | CN114332469A | 公开(公告)日: | 2022-04-12 | 
| 发明(设计)人: | 刘松涛;李蓝青 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 | 
| 主分类号: | G06V10/40 | 分类号: | G06V10/40;G06V10/774;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08;G06N20/00 | 
| 代理公司: | 北京励诚知识产权代理有限公司 11647 | 代理人: | 赵爽 | 
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 模型 训练 方法 装置 设备 存储 介质 | ||
本申请提供了一种模型训练方法、装置、设备及存储介质,该方法包括:获取第一训练图数据和N组超参,第一训练图数据包括R个数据对,每个数据对由图网络中的一个中心节点的第一特征信息和中心节点的一个邻居图节点的第一特征信息组成;将第一训练图数据分别输入N组超参中每一组超参下的生成器中,以使生成器学习在给定中心节点的特征条件下中心节点的邻居节点的特征概率分布,得到N组超参中每一组超参下训练后的生成器;从N组超参下训练后的生成器中,确定出目标生成器,目标生成器用于生成第二抽样样本,第二抽样样本用于训练预设的图神经网络模型,解决了模型在训练时由于缺少样本而过拟合的问题,提升模型的鲁棒性和泛化性。
技术领域
本申请实施例涉及人工智能技术领域,尤其涉及一种模型训练方法、装置、设备及存储介质。
背景技术
随着人工智能技术的快速发展,各种图神经网络模型应用而生,图神经网络模型的预测精度与训练过程紧密相关,而模型训练与样本的准备相关。例如,当样本空间不够或者样本数量不足的时候会严重影响训练或者导致训练出来的模型泛化程度不够,识别率与准确率不高。
因此,如何解决样本数量不足造成的模型训练泛化程度不够,成为本领域技术人员亟待解决的技术问题。
发明内容
本申请提供一种模型训练方法、装置、设备及存储介质,训练得到的生成器可以生成用于模型训练的抽样样本,以实现对模型的充分训练。
第一方面,本申请提供一种模型训练方法,包括:
获取第一训练图数据和N组超参,所述第一训练图数据包括R个数据对,每个数据对由图网络中的一个中心节点的第一特征信息和所述中心节点的一个邻居图节点的第一特征信息组成,所述N、R均为正整数;
将所述第一训练图数据分别输入所述N组超参中每一组超参下的生成器中,以使所述生成器学习在给定中心节点的特征条件下所述中心节点的邻居节点的特征概率分布,得到所述N组超参中每一组超参下训练后的生成器;
从N组超参下训练后的生成器中,确定出目标生成器,所述目标生成器用于生成第二抽样样本,所述第二抽样样本用于训练预设的图神经网络模型。
第二方面,提供了一种模型训练装置,包括:
获取单元,用于获取第一训练图数据和N组超参,所述第一训练图数据包括R个数据对,每个数据对由图网络中的一个中心节点的第一特征信息和所述中心节点的一个邻居图节点的第一特征信息组成,所述N、R均为正整数;
训练单元,用于将所述第一训练图数据分别输入所述N组超参中每一组超参下的生成器中,以使所述生成器学习在给定中心节点的特征条件下所述中心节点的邻居节点的特征概率分布,得到所述N组超参中每一组超参下训练后的生成器;
确定单元,用于从N组超参下训练后的生成器中,确定出目标生成器,所述目标生成器用于生成第二抽样样本,所述第二抽样样本用于训练预设的图神经网络模型。
在一些实施例中,确定单元,具体用于针对所述N组超参中的每一组超参,使用该组超参下训练后的生成器进行抽样,得到该组超参下训练后的生成器输出的第一抽样样本,并使用该组超参下训练后的生成器输出的第一抽样样本,对预设的第一预测模型进行训练,得到该组超参对应的训练后的第一预测模型;分别确定每一组超参对应的训练后的第一预测模型的预测准确度;将预测准确度最高的第一预测模型所对应的一组超参下训练后的生成器,确定为所述目标生成器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110975270.4/2.html,转载请声明来源钻瓜专利网。





