[发明专利]模型训练方法、商户分类方法及装置在审
申请号: | 202110448644.7 | 申请日: | 2021-04-25 |
公开(公告)号: | CN113761250A | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 黄薇屹;洪立涛;王波;苏函晶;韩宝昌;陶淳 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/55 | 分类号: | G06F16/55;G06F16/583;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 李汉亮 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 商户 分类 装置 | ||
本发明实施例公开了一种模型训练方法、商户分类方法及装置,方法通过获取训练样本集合;根据样本数据以及样本数据之间的关联度关系构建样本数据之间的图结构数据;将图结构数据输入图神经网络,得到输出的多个样本节点向量;获取每一样本节点向量在预设场景下的标签信息;采用多个样本节点向量以及每一样本节点向量对应的标签信息训练第一预设模型,得到训练后的第一预设模型。以此,本申请采用机器学习方法根据样本数据之间的关联度关系生成图结构数据,再从图结构数据中提取出每个样本的特征向量进行模型训练,该方法利用样本之间的关联度关系进行增强训练,改善了模型训练效果,提升了模型处理的准确性。
技术领域
本发明涉及计算机技术领域,具体涉及一种模型训练方法、商户分类方法及装置。
背景技术
机器学习(Machine Learning,ML)专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径。
在机器学习领域中,通常需要利用样本数据的特征信息对网络模型进行训练,以得到各种不同功能的网络模型。
目前利用样本数据进行模型训练,只孤立地使用每个样本的特征对模型进行训练,导致模型训练的效果较差。
发明内容
本申请实施例提供一种模型训练方法、商户分类方法及装置,该方法可以根据样本数据之间的关联度关系生成图结构数据,再从图结构数据中提取出每个样本的特征向量进行模型训练,该方法充分利用了样本之间的关联关系,改善了模型训练效果,提升了模型处理的准确性。
本申请第一方面提供一种模型训练方法,包括:
获取训练样本集合,所述训练样本集合包括样本数据以及样本数据之间的关联度关系;
根据所述样本数据以及样本数据之间的关联度关系构建所述样本数据之间的图结构数据,所述图结构数据中包括样本数据转化的样本节点和样本节点之间的边关系数据;
将所述图结构数据输入图神经网络,得到输出的多个样本节点向量;
获取每一样本数据在预设场景下的标签信息;
采用所述多个样本节点向量以及所述每一样本节点向量对应的标签信息训练第一预设模型,得到训练后的第一预设模型。
相应的,本申请第二方面提供一种模型训练装置,包括:
第一获取单元,获取训练样本集合,所述训练样本集合包括样本数据以及样本数据之间的关联度关系;
第一构建单元,用于根据所述样本数据以及样本数据之间的关联度关系构建所述样本数据之间的图结构数据,所述图结构数据中包括样本数据转化的样本节点和样本节点之间的边关系数据;
第一输入单元,用于将所述图结构数据输入图神经网络,得到输出的多个样本节点向量;
第二获取单元,用于获取每一样本数据在预设场景下的标签信息;
第一训练单元,用于采用所述多个样本节点向量以及所述每一样本节点向量对应的标签信息训练第一预设模型,得到训练后的第一预设模型。
在一些实施例中,所述装置还包括:
第三获取单元,用于获取每一样本数据的统计特征数据;
第二训练单元,用于采用所述每一样本数据的统计特征数据以及每一样本数据在所述预设场景下的标签信息训练第二预设模型,得到训练后的第二预设模型;
第三训练单元,用于基于所述训练后的第一预设模型的输出与所述训练后的第二预设模型的输出训练预设分类模型,得到训练后的预设分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110448644.7/2.html,转载请声明来源钻瓜专利网。