[发明专利]图嵌入模型的训练方法及装置在审
申请号: | 201910563297.5 | 申请日: | 2019-06-26 |
公开(公告)号: | CN112149696A | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 吴怡灵;谢奕;窦亚光;谷松 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 嵌入 模型 训练 方法 装置 | ||
本发明提出一种图嵌入模型的训练方法及装置,其中方法包括:获取初始的图嵌入模型,图嵌入模型的数量为多个,分别部署在多个机器上;针对每轮训练,在当前轮次为非初始轮次时,针对每个图嵌入模型,根据当前轮次训练数据确定待更新参数信息;根据上一轮次的已训练参数信息对初始的图嵌入模型中的待更新参数信息进行更新,得到参数更新后的图嵌入模型;采用当前轮次训练数据,对参数更新后的图嵌入模型进行训练;根据多个当前轮次训练后的图嵌入模型的已训练参数信息以及上一轮次的已训练参数信息,确定当前轮次的已训练参数信息,从而能够结合多个机器对图嵌入模型进行训练,能够应用于海量节点的节点网络,提高海量节点的节点网络的降维效率。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种图嵌入模型的训练方法及装置。
背景技术
目前,随着社交网络的普及,每个虚拟ID在网络中的形象也变得更加丰富,以虚拟ID作为节点,组成了节点网络。为了挖掘节点网络中的信息,需要将节点网络嵌入到低维空间中,每个虚拟ID用低维向量表示。
目前的降维方法有node2vec等图嵌入模型。现有的tensorflow和gensim等开源工具能够结合该方法实现对节点的降维。但上述开源工具是采用一个机器来进行图嵌入模型的训练,机器的性能受限,导致能够处理的数据量小,难以应用于亿万级别节点的节点网络,导致亿万级别节点的节点网络的降维效率差。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种图嵌入模型的训练方法,用于解决现有技术中海量节点的节点网络的降维效率差的问题。
本发明的第二个目的在于提出一种图嵌入模型的训练装置。
本发明的第三个目的在于提出另一种图嵌入模型的训练装置。
本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
本发明的第五个目的在于提出一种计算机程序产品。
为达上述目的,本发明第一方面实施例提出了一种图嵌入模型的训练方法,包括:
获取初始的图嵌入模型,所述图嵌入模型的数量为多个,分别部署在多个机器上;
针对每轮训练,在当前轮次为非初始轮次时,针对每个图嵌入模型,获取所述图嵌入模型的当前轮次训练数据,根据所述当前轮次训练数据确定待训练参数信息;
根据上一轮次的已训练参数信息对初始的图嵌入模型中的所述待训练参数信息进行更新,得到参数更新后的图嵌入模型;
采用所述当前轮次训练数据,对所述参数更新后的图嵌入模型进行训练,得到当前轮次训练后的图嵌入模型;
根据多个当前轮次训练后的图嵌入模型的已训练参数信息,以及上一轮次的已训练参数信息,确定当前轮次的已训练参数信息;
在当前轮次满足预设轮次,或者多个图嵌入模型的损失函数满足预设条件时,结束训练。
进一步的,所述的方法还包括:
在当前轮次为初始轮次时,针对每个图嵌入模型,获取所述图嵌入模型的初始轮次训练数据;
采用所述初始轮次训练数据,对所述图嵌入模型进行训练,得到初始轮次训练后的图嵌入模型;
根据多个初始轮次训练后的图嵌入模型的已训练参数信息,确定初始轮次的已训练参数信息。
进一步的,所述针对每个图嵌入模型,获取所述图嵌入模型的当前轮次训练数据,根据所述当前轮次训练数据确定待训练参数信息,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910563297.5/2.html,转载请声明来源钻瓜专利网。