[发明专利]基于无监督学习的用户分类方法、装置、设备及存储介质在审
申请号: | 201911001169.8 | 申请日: | 2019-10-21 |
公开(公告)号: | CN110737730A | 公开(公告)日: | 2020-01-31 |
发明(设计)人: | 黄文炳;徐挺洋;荣钰;黄俊洲 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28 |
代理公司: | 44224 广州华进联合专利商标代理有限公司 | 代理人: | 冯右明 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征表达式 拓扑关系确定 分类用户 拓扑关系 用户分类 原始特征 无监督学习 损失函数 有效降低网络 计算机设备 存储介质 网络用户 用户标签 用户类别 相关度 构建 输出 分类 | ||
本发明涉及基于无监督学习的用户分类方法、装置、计算机设备及存储介质,属于用户分类技术领域。该方法包括:获取待分类用户的第一原始特征;将第一原始特征输入到无监督学习的拓扑关系确定模型中;拓扑关系确定模型对应有目标损失函数;目标损失函数根据第一特征表达式和第二特征表达式的相关度构建;第一特征表达式为第一原始特征对应的表达式,第二特征表达式为拓扑关系特征对应的表达式;根据拓扑关系确定模型的输出,得到待分类用户的目标拓扑关系特征;根据目标拓扑关系特征,确定待分类用户对应的用户类别。上述技术方案,在不需要人工提供用户标签的情况下,就能实现对网络用户的准确分类,能有效降低网络用户分类的成本。
技术领域
本发明涉及用户分类技术领域,特别是涉及基于无监督学习的用户分类方法、装置、计算机设备及存储介质。
背景技术
随着网络技术的发展,网络用户的数量和种类越来越繁杂。很多情况下,需要对网络用户进行分类,并针对性地进行网络操作,例如:在社交网络分析领域,根据用户(在用户关系图中也可以称为节点)的特点进行精准广告投放、商品推荐、危险用户监控等。目前,主要通过用户关系图中的拓扑关系特征来表示用户信息以及各个用户之间的关系,并据此进行用户的分类。
在实现本发明过程中,发明人发现传统方式中至少存在如下问题:传统技术主要是通过监督式的方法来训练模型并确定拓扑关系特征。但监督式的方法需要依赖人工辅助,由人工提供用户标签。实际上,在网络用户分析中,由于涉及亿级以上的用户量,利用人工对各个用户进行标注的成本非常高,这就导致用户分类的成本非常高。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
基于此,本发明实施例提供了基于无监督学习的用户分类方法、装置、计算机设备及存储介质,能有效降低对用户进行分类的成本。
本发明实施例的内容如下:
第一方面,本发明实施例提供一种基于无监督学习的用户分类方法,包括以下步骤:获取待分类用户的第一原始特征;将所述第一原始特征输入到无监督学习的拓扑关系确定模型中;所述拓扑关系确定模型对应有目标损失函数;所述目标损失函数根据第一特征表达式和第二特征表达式的相关度构建;所述第一特征表达式为所述第一原始特征对应的表达式,所述第二特征表达式为拓扑关系特征对应的表达式;所述拓扑关系特征用于表征所述待分类用户在用户关系图中的拓扑关系;根据所述拓扑关系确定模型的输出,得到所述待分类用户的目标拓扑关系特征;根据所述目标拓扑关系特征,确定所述待分类用户对应的用户类别。
第二方面,本发明实施例提供一种基于无监督学习的用户分类装置,包括:原始特征获取模块,用于获取待分类用户的第一原始特征;特征输入模块,用于将所述第一原始特征输入到无监督学习的拓扑关系确定模型中;所述拓扑关系确定模型对应有目标损失函数;所述目标损失函数根据第一特征表达式和第二特征表达式的相关度构建;所述第一特征表达式为所述第一原始特征对应的表达式,所述第二特征表达式为拓扑关系特征对应的表达式;所述拓扑关系特征用于表征所述待分类用户在用户关系图中的拓扑关系;拓扑关系确定模块,用于根据所述拓扑关系确定模型的输出,得到所述待分类用户的目标拓扑关系特征;用户类别确定模块,用于根据所述目标拓扑关系特征,确定所述待分类用户对应的用户类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911001169.8/2.html,转载请声明来源钻瓜专利网。