[发明专利]一种编码器的训练方法、信息检测的方法以及相关装置有效
申请号: | 202010207256.5 | 申请日: | 2020-03-23 |
公开(公告)号: | CN111291190B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 刘巍 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/901;G06N3/0464;G06N3/0442;G06N3/08 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 编码器 训练 方法 信息 检测 以及 相关 装置 | ||
本申请公开了一种应用于人工智能领域的编码器训练方法,包括:根据第一图数据获取N个节点所对应的特征向量集合;根据特征向量集合,通过样本聚合图自编码器对每个节点所对应的特征向量进行编码处理,得到N个第一编码向量以及N个第二编码向量;根据N个第一编码向量、N个第二编码向量以及N个随机噪声,生成对应的N个隐藏向量;通过解码器对N个隐藏向量进行解码处理,得到第二图数据;根据第一图数据以及第二图数据,采用损失函数对样本聚合图自编码器的第一模型参数进行更新。本申请还公开了一种信息检测的方法以及相关装置。本申请不但能够对未知节点起到泛化作用,而且在训练过程中引入随机噪声,有利于提升网络的性能。
技术领域
本申请涉及人工智能领域,尤其涉及一种编码器的训练方法、信息检测的方法以及相关装置。
背景技术
近年来,在图数据中进行数据挖掘,已成为自然语言处理领域的研究热点之一。和普通数据不同,图中的数据挖掘需要对节点之间的联系进行更复杂的建模,这不仅需要充分考虑节点自身的属性,同时也要考虑节点的各个邻居对节点的影响。
目前,基于图结构的广义人工神经网络,已提出一种图自编码器(graph auto-encoder,GAE),GAE中使用编码器(encoder)来提取节点的特征,再利用自编码器(auto-encoder,AE)的架构来进行无监督学习。
然而,GAE只能学习到已经训练过的节点特征,无法很好地处理未曾见过的节点特征,事实上,对于大量的图数据而言,要学习到每个节点的特征是非常困难的,导致编码器的学习效果较差。
发明内容
本申请实施例提供了一种编码器的训练方法、信息检测的方法以及相关装置,在变分自编码器的架构下,基于样本聚合图自编码器可以对节点进行归纳学习,不但能够对未知节点起到泛化作用,而且在训练过程中引入随机噪声,有利于提升网络的性能,使得编码的效果更好。
有鉴于此,本申请第一方面提供一种编码器的训练方法,包括:
根据第一图数据获取N个节点所对应的特征向量集合,其中,特征向量集合中包括N个特征向量,且每个特征向量对应于图中的一个节点,N为大于或等于2的整数;
根据特征向量集合,通过样本聚合图自编码器对每个节点所对应的特征向量进行编码处理,得到N个第一编码向量以及N个第二编码向量,其中,样本聚合图自编码器为通过图样本聚合网络进行编码的自编码器;
根据N个第一编码向量、N个第二编码向量以及N个随机噪声,生成对应的N个隐藏向量,其中,第一编码向量、第二编码向量、随机噪声与隐藏向量之间具有对应关系;
通过解码器对N个隐藏向量进行解码处理,得到第二图数据;
根据第一图数据以及第二图数据,采用损失函数对样本聚合图自编码器的第一模型参数进行更新。
本申请第二方面提供一种信息检测的方法,包括:
接收客户端发送的信息检测请求,其中,分类请求携带目标节点的标识以及客户端的标识;
根据信息检测请求获取目标节点所对应的特征向量;
基于目标节点所对应的特征向量,通过样本聚合图自编码器获取目标节点所对应的第一编码向量以及目标节点所对应的第二编码向量,其中,样本聚合图自编码器为采用第一方面提供的方法训练得到的;
根据目标节点所对应的第一编码向量、目标节点所对应的第二编码向量以及随机噪声,生成目标节点所对应的隐藏向量;
基于目标节点所对应的隐藏向量,通过分类网络模型获取目标节点的分类概率;
根据目标节点的分类概率确定目标节点的信息检测结果;
根据信息检测请求,向客户端推送目标节点的信息检测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010207256.5/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置