[发明专利]用户身份识别方法、装置及服务器有效
| 申请号: | 201910524888.1 | 申请日: | 2019-06-17 |
| 公开(公告)号: | CN110222790B | 公开(公告)日: | 2021-05-25 |
| 发明(设计)人: | 王晓;袁春峰;纪翀 | 申请(专利权)人: | 南京中孚信息技术有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/00 |
| 代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 刘亚飞 |
| 地址: | 210000 江苏省南京市浦口区江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用户 身份 识别 方法 装置 服务器 | ||
本发明提供了一种用户身份识别方法、装置及服务器,该方法包括:从多个社交网络中获取待识别的未知用户的公开数据;对所述未知用户的公开数据进行聚类分析,得到至少一个相似用户群;分别获取预设时间间隔内所述相似用户群中的每个未知用户与各所述社交网络中已知用户的关联信息;根据所述关联信息,从所述相似用户群中识别出具有同一身份的用户。本发明可以有效提高用户身份识别的准确率。
技术领域
本发明涉及社交网络技术领域,尤其是涉及一种用户身份识别方法、装置及服务器。
背景技术
随着互联网的发展,诸如腾讯微博、新浪微博和人人网等多种社交网络出现逐渐在用户的视野中,用户可以活跃于各种社交网络中以不同形象与他人进行交互,产生散布在各个社交网络的独立数据集,例如,用户X在社交网络1中通过账号A与他人交互,在社交网络2中通过账号B与他人交互,在社交网站3中通过账号C与他人交互,所用的不同账号下的信息可能相同或不同,诸如在社交网络1中的名称为“张三”,在社交网络2中的名称为“李四”等,但在社交网络1~3中的性别都设定为“男”,年龄均设定为“28”岁。因此社交网络1、社交网络2和社交网络3中均存在用户X的独立数据集,将用户X的散布于各个社交网络的独立数据集关联起来,对许多数据挖掘分析意义重大。
将用户散布于各个社交网络的独立数据关联起来的前提是在各个社交网络中识别出具有同一身份的用户,现有技术中,通常是通过获取用户在社交网站中公开的用户资料判断多个社交网站上的某个账号是否属于同一用户,该方式受公开资料的限制较大,若用户公开资料不准确或者公开资料不全,则将无法准确识别出各个社交网络中具有同一身份的用户,导致用户身份识别准确率较低。
发明内容
有鉴于此,本发明的目的在于提供一种用户身份识别方法、装置及服务器,可以有效提高用户身份识别的准确率。
第一方面,本发明实施例提供了一种用户身份识别方法,包括:从多个社交网络中获取待识别的未知用户的公开数据;对所述未知用户的公开数据进行聚类分析,得到至少一个相似用户群;分别获取预设时间间隔内所述相似用户群中的每个未知用户与各所述社交网络中已知用户的关联信息;根据所述关联信息,从所述相似用户群中识别出具有同一身份的用户。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,所述对所述未知用户的公开数据进行聚类分析,得到至少一个相似用户群的步骤,包括:通过OPTICS(Ordering points to identify the clustering structure)算法或DBSCAN(Density-Based Spatial Clustering of Applications with Noise)算法计算所述未知用户的公开数据的相似性度量,基于所述相似性度量得到至少一个相似用户群。
结合第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第二种可能的实施方式,其中,所述公开数据包括可编辑数据和非编辑数据;所述通过OPTICS算法或DBSCAN算法计算所述未知用户的公开数据的相似性度量的步骤,包括:统计所述公开数据中非编辑数据相同的未知用户,得到数据相同数量;并计算所述公开数据中可编辑数据的数据相似值;根据所述数据相同数量和所述数据相似值计算所述未知用户的公开数据的相似性度量。
结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,所述根据所述关联信息,从所述相似用户群中识别出具有同一身份的用户的步骤,包括:根据所述关联信息,计算所述相似用户群中每个未知用户针对各所述社交网络的相似值;根据所述相似值,从所述相似用户群中分别识别出具有同一身份的用户。
结合第一方面的第三种可能的实施方式,本发明实施例提供了第一方面的第四种可能的实施方式,其中,所述根据所述关联信息,计算所述相似用户群中每个未知用户针对各所述社交网络的相似值的步骤,包括:按照以下公式计算所述相似用户群中每个未知用户针对各所述社交网络的相似值D:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京中孚信息技术有限公司,未经南京中孚信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910524888.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图像识别方法及存储介质
- 下一篇:样本标注信息的审核方法及装置





