[发明专利]一种跨平台识别用户的方法及装置在审
申请号: | 201911017272.1 | 申请日: | 2019-10-24 |
公开(公告)号: | CN110826605A | 公开(公告)日: | 2020-02-21 |
发明(设计)人: | 安达;江金陵 | 申请(专利权)人: | 北京明略软件系统有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/35 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 胡艳华;栗若木 |
地址: | 102218 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 平台 识别 用户 方法 装置 | ||
本文公开了一种跨平台识别用户的方法及装置。所述跨平台识别用户的方法包括:基于用户资料将用户身份信息相似的多个平台的用户进行聚类,生成多个用户块;对用户块内的用户在平台上发表的内容进行分析和特征提取,获得用户发表内容的文本特征;将用户发表内容的文本特征进行文本数字化处理,得到用户发表内容的数字化特征;根据用户发表内容的数字化特征对用户块内的用户进行匹配,将用户发表内容的相似度满足预设要求的两个用户识别为同一个人注册的不同用户。本文的技术方案能够快速实现跨平台识别用户,算法简单,识别效率高。
技术领域
本发明涉及计算机技术领域,尤其涉及的是一种跨平台识别用户的方法及装置。
背景技术
同一用户可能在不同的平台(比如,社交平台、购物平台、视频网站等)同时拥有账号,识别和匹配出这些账号后可以进行好友推荐、产品推广等。
在跨平台进行用户识别和匹配时,可以基于社交网络的关系网络结构(比如好友关系,关注与被关注等)进行图计算。但是,社交网络的关系计算非常复杂,随着关系网层数的增加,计算量呈几何级数增加。另一方面,同一用户不同平台的好友关系可能并不稳定,比如,用户在A平台和B平台的好友可能并不是同一批人。
发明内容
本文提供一种跨平台识别用户的方法及装置,能够快速实现跨平台识别用户,算法简单,识别效率高。
根据本申请的第一方面,本发明实施例提供一种跨平台识别用户的方法,包括:
基于用户资料将用户身份信息相似的多个平台的用户进行聚类,生成多个用户块;
对用户块内的用户在平台上发表的内容进行分析和特征提取,获得用户发表内容的文本特征;
将用户发表内容的文本特征进行文本数字化处理,得到用户发表内容的数字化特征;
根据用户发表内容的数字化特征对用户块内的用户进行匹配,将用户发表内容的相似度满足预设要求的两个用户识别为同一个人注册的不同用户。
根据本申请的第二方面,本发明实施例提供一种跨平台识别用户的装置,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的跨平台识别用户的程序,所述跨平台识别用户的程序被所述处理器执行时实现上述跨平台识别用户的方法的步骤。
根据本申请的第三方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有跨平台识别用户的程序,所述跨平台识别用户的程序被处理器执行时实现上述跨平台识别用户的方法的步骤。
与相关技术相比,本发明实施例提供的一种跨平台识别用户的方法及装置,基于用户资料将用户身份信息相似的多个平台的用户进行聚类,生成多个用户块,上述分块处理能够缩小数据的匹配范围。对用户块内的用户在平台上发表的内容进行分析和特征提取,获得用户发表内容的文本特征,将用户发表内容的文本特征进行文本数字化处理,得到用户发表内容的数字化特征,根据用户发表内容的数字化特征对用户块内的用户进行匹配,将用户发表内容的相似度满足预设要求的两个用户识别为同一个人注册的不同用户。上述匹配算法在块内进行数据匹配,而块间无需做任何匹配,因此匹配范围大大缩小。并且通过将用户在平台上发表的内容作为一个整体进行特征提取,特征提取的范围更全面,从而提高了文本匹配的精确度。本发明实施例的技术方案能够快速实现跨平台识别用户,算法简单,识别效率高。上述实施例提出的跨平台识别用户的方法在好友推荐、产品推广方面具有很高的实用价值。
附图说明
图1为本发明实施例1的一种跨平台识别用户的方法的流程图;
图2为本发明实施例1中的一种Canopy聚类算法的流程图;
图3为本发明实施例1中的一种Canopy聚类算法的数据分布示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911017272.1/2.html,转载请声明来源钻瓜专利网。