[发明专利]针对社交网络用户属性的推演方法及装置有效
申请号: | 201810502401.5 | 申请日: | 2018-05-23 |
公开(公告)号: | CN108921189B | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 毛剑;田文倩;杨晨;关振宇;刘建伟 | 申请(专利权)人: | 北京航空航天大学;中国信息安全研究院有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/00 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张润 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 针对 社交 网络 用户 属性 推演 方法 装置 | ||
本发明公开了一种针对社交网络用户属性的推演方法及装置,其中,方法包括以下步骤:根据与原始簇一一对应的第一标签用户节点的第一特征向量得到第一标签用户节点所在原始簇的第一均值特征向量;根据第一标签用户节点和第二标签用户节点在网络图结构上的连接距离特征得到第二标签用户节点的第二特征向量;根据第二特征向量和第二标签用户节点迭代更新第二标签用户节点的标记簇,并在第二均值特征向量满足预设条件时停止迭代。该方法可以实现根据社交网络中少量显性属性信息,高效地推演出更多用户的隐性属性信息,有效提高推演的准确性和适用性,简单易实现。
技术领域
本发明涉及计算机、通信和信息安全技术领域,特别涉及一种针对社交网络用户属性的推演方法及装置。
背景技术
随着移动互联网的迅速发展,社交网络信息分析与挖掘成为了工业界与学术界的热点研究议题。社交网络汇聚着庞大的人际网络关系信息和各种属性、行为等信息。基于社交网络内容的现实应用需求,社交网络平台的运营商会基于特定需求将社交网络信息(关系、属性、行为)进行部分开放,与诸如广告商、市场分析机构、科研机构等组织共享。分析社交网络的用户属性特征能够帮助社交网络运营商给用户提供更多便捷优质的服务,同时也能为研究用户行为的影响力、用户偏好等提供基础数据支撑。
社交网络中用户通常只显示部分或者不显示自己的属性信息,而用户的人际关系通常是直接显露出来的。通过人际关系和部分显性的属性信息(用户在社交网络中展示出来的属性信息)能推演出用户的其他隐性属性信息(用户在社交网络中没有展示的属性信息)。目前在社交网络属性推演的研究中,主要有以下几种方法:基于社区发现的算法、基于传统机器学习的方法、基于投票的方法、基于随机游走的方法。每种方法有着各自的优缺点,适用于不同的场景。基于社区发现的算法考虑同质性,认为相似的用户之间具有更密集的关系;基于传统机器学习的方法利用已知用户生成的特征向量样本训练分类器,对未知用户信息进行预测;基于投票的方法采用迭代的方法累积用户从邻居节点获得的权重,并选取最大的权重的属性赋予未知用户;基于随机游走的方法从未知用户出发,沿着关系图移动,最终将停留的已知用户对应的属性赋予该未知用户。
然而,相关技术中的属性推演方法缺少应用于超大规模社交网络数据集的算法性能测试,另外在大规模社交网络数据集中,已知的用户属性占少部分,从少数已知属性推演出大量未知属性的精确度有待提高,推演的精度差,且适用性差。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的一个目的在于提出一种针对社交网络用户属性的推演方法,该方法可以实现根据社交网络中少量显性属性信息,高效地推演出更多用户的隐性属性信息,有效提高推演的准确性和适用性,简单易实现。
本发明的另一个目的在于提出一种针对社交网络用户属性的推演装置。
为达到上述目的,本发明一方面实施例提出了一种针对社交网络用户属性的推演方法,包括以下步骤:根据与所述原始簇一一对应的第一标签用户节点的第一特征向量得到所述第一标签用户节点所在原始簇的第一均值特征向量;根据所述第一标签用户节点和第二标签用户节点在网络图结构上的连接距离特征得到所述第二标签用户节点的第二特征向量;根据所述第二特征向量和所述第二标签用户节点迭代更新所述第二标签用户节点的标记簇,并在第二均值特征向量满足预设条件时停止迭代。
本发明实施例的针对社交网络用户属性的推演方法,利用半监督学习技术,仅根据社交网络用户关系结构特性,即用户之间互为朋友、关注与被关注等这类关系信息和少量的已知属性信息的用户,推演出未知属性信息用户的属性,同时具有高效性并能够适用于多场景,从而实现根据社交网络中少量显性属性信息,高效地推演出更多用户的隐性属性信息,有效提高推演的准确性和适用性,简单易实现。
另外,根据本发明上述实施例的针对社交网络用户属性的推演方法还可以具有以下附加的技术特征:
进一步地,在本发明的一个实施例中,所述第一均值特征向量为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学;中国信息安全研究院有限公司,未经北京航空航天大学;中国信息安全研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810502401.5/2.html,转载请声明来源钻瓜专利网。