[发明专利]一种基于GCN推荐的样本密度聚合方法在审
申请号: | 202110358626.X | 申请日: | 2021-04-02 |
公开(公告)号: | CN112925984A | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 董立岩;王浩;马心陶;刘元宁;朱晓冬 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06N3/08;G06N3/04 |
代理公司: | 长春市恒誉专利代理事务所(普通合伙) 22212 | 代理人: | 鞠传龙 |
地址: | 130012 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 gcn 推荐 样本 密度 聚合 方法 | ||
本发明公开了一种基于GCN推荐的样本密度聚合方法,其方法为:步骤一、收集GCN模型的原始数据样本;步骤二、计算出邻接矩阵的度矩阵以及高阶度矩阵;步骤三、将步骤二得到的高阶度矩阵将它们聚合为一个最终形式的度矩阵;步骤四、使用已经固定下来的协调参数设置来完成对原始样本数据的预处理过程。本发明的有益效果:使得原始样本中每个对象所携带的信息量增多了。因此在GCN训练时,神经网络能够更完整和准确的得到每个对象的密度特征属性,从而减少了推荐系统的推荐错误率。该技术优化方法能够给依赖GCN的业务用户带来更好的直接应用体验。已经测试该方法的实际表现,以此证明该方法确实行之有效。
技术领域
本发明涉及一种样本密度聚合方法,特别涉及一种基于GCN推荐的样本密度聚合方法。
背景技术
目前,基于GCN的推荐系统模型已经在很多领域进行了应用,它将一些对象的特征进行数据化表示。然后使用图卷积神经网络将这些对象的特征进行量化,从而编辑出它所对应的实际类型。例如,在一个电商网站中,每个用户都有自己喜欢的商品或者品牌,而GCN可以通过分析商品的关系网和用户与商品间的联系来得到每个用户在某类商品上的兴趣程度。然后推荐系统将该类商品推荐给对应的用户。
但是由于当前GCN还存在着一个技术缺陷,导致使用GCN的模型不能够充分而准确的获取目标的特征属性。该缺陷是由于GCN缺少对目标领域原始样本的预处理所致,尤其缺少对关系网中每个对象的邻接密度特征的分析。
发明内容
本发明的目的是为了解决GCN模型不能够充分而准确的获取目标的特征属性的问题,而提供的一种基于GCN推荐的样本密度聚合方法。
本发明提供的基于GCN推荐的样本密度聚合方法,其方法包括如下步骤:
步骤一、收集GCN模型的原始数据样本,将原始的关系网络整理为对象邻接表和对象与属性的关系表,将它们作为下一步计算的依据;
步骤二、计算出邻接矩阵的度矩阵以及高阶度矩阵,就是将邻接矩阵中的每行进行度数加权时,再额外的添加计算其邻接对象的度数的过程,通过编程中的循环语句完成,该过程得到不同阶的度矩阵;
步骤三、将步骤二得到的高阶度矩阵以D=D1+α1D2+α2D3的形式将它们聚合为一个最终形式的度矩阵D,然后使用该矩阵计算图的拉普拉斯矩阵L,计算方法为L=D-1/2AD-1/2,然后将获得的拉普拉斯矩阵进行归一化,并使用它进行特征映射和训练,在使用之前需要确定协调参数α1和α2的值,协调参数的值往往存在一个可用的取值区间,使用统计的办法画出模型表现分布曲线获得它们的取值区间,具体过程如下:
首先需要确定低阶协调参数的取值范围,使用GCN模型训练并进行推荐,然后记录下当低阶协调参数的值为某个值的时候模型的准确率,并记录下来。进行下一轮统计时等距离增加或者减少协调参数的值,这个间隔一般很小,通常在0.005到0.2之间,在这个过程中模型的表现曲线多数会呈现二次函数的形式,找到最大值所对应的协调参数,对于高阶的协调参数取值也是通过同样的方法得到,但是这时低阶的协调参数应该已经固定,对于协调参数初始值的设定根据阶数而异;
步骤四、使用已经固定下来的协调参数设置来完成对原始样本数据的预处理过程,然后使用处理后的样本进行GCN网络推荐,并获得质量更高的推荐内容,在设定时间之后,由于关系网络的变动,应当重新统计协调参数的值。
本发明的有益效果:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110358626.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于远程控制身份认证的管理系统
- 下一篇:利用水合试剂制备催化剂的方法