[发明专利]社交平台用户的现实关系匹配方法、装置及可读存储介质有效
申请号: | 201710827452.0 | 申请日: | 2017-09-14 |
公开(公告)号: | CN107741953B | 公开(公告)日: | 2020-01-21 |
发明(设计)人: | 王健宗;吴天博;黄章成;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06Q10/04;G06Q50/00 |
代理公司: | 44287 深圳市世纪恒程知识产权代理事务所 | 代理人: | 胡海国 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社交 平台 用户 现实 关系 匹配 方法 装置 可读 存储 介质 | ||
本发明公开了一种社交平台用户的现实关系匹配方法,包括步骤:获取社交平台上的用户的账号信息,根据每一所述用户的账号信息和TransE模型建立用户向量模型;获取所述社交平台上的用户之间的文本交互信息,根据所述用户之间的文本交互信息和卷积神经网络模型建立文本关系预测模型;将所述用户向量模型的输出结果以及所述文本关系预测模型的输出结果投射到同一个空间进行线性联合输出,以得到所述社交平台上的用户的现实关系预测结果。本发明结合用户的账号信息和用户之间的交互文本信息分析的方式,可以从社交平台里上亿的海量用户中准确的挖掘出在线用户的现实关系。本发明还提供一种数据处理装置及计算机可读存储介质。
技术领域
本发明涉及计算机网络技术领域,尤其涉及一种社交平台用户的现实关系匹配方法、数据处理装置及计算机可读存储介质。
背景技术
随着互联网的发展,微博、朋友圈、脸书(Facebook)以及推特(Twitter)等各类社交平台的流行,如何从上亿的海量用户中准确的挖掘出在线用户的现实关系,例如朋友、熟人和家人等亲密关系成为了一个重要的课题。
传统的社交网络分析中,通常做法是根据网络结构进行节点间距离的衡量,或者用聚类方法找到团簇来划分节点,在社交拓扑网络结构中通过不同的算法来计算用户之间的相似度,从而判断用户之间的关系。但是,由于社交网络特性,不少节点间虽然距离近,但是他们可能只是线上好友,线下或真实生活中根本没有见过面。
而在例如金融产品领域、公共安全监控领域等应用中,正确地计算和识别在线用户在现实生活中的亲密关系才是最迫切需要的。
发明内容
本发明的主要目的在于提供一种在线社交用户的现实关系匹配方法、数据处理装置及计算机可读存储介质,旨在解决如何准确地计算和识别在线用户在现实生活中的亲密关系的技术问题。
为实现上述目的,本发明提供的一种社交平台用户的现实关系匹配方法,包括以下步骤:
获取社交平台上的用户的账号信息,根据每一所述用户的账号信息和TransE模型建立用户向量模型;
获取所述社交平台上的用户之间的文本交互信息,根据所述用户之间的文本交互信息和卷积神经网络模型建立文本关系预测模型;
将所述用户向量模型的输出结果以及所述文本关系预测模型的输出结果投射到同一个空间进行线性联合输出,以得到所述社交平台上的用户的现实关系预测结果。
进一步地,所述根据每一所述用户的账号信息和TransE模型建立用户向量模型的步骤包括:
根据每一所述用户的账号信息建立一个三元组<h,r,t>,其中,h,t是用户的账号信息中的实体,r是连接所述实体h,t之间的关系;
根据TransE模型把所述每一个三元组<h,r,t>中每个实体和实体之间的关系映射为包含每个实体和实体之间的关系的低维度向量。
进一步地,所述用户向量模型的目标函数包括:
其中,<h,r,t>∈R(k×1),k是向量维度,[*]+为取*的正数部分,γ是一个超参数,S是所有真三元组集合,S'是所有随机生成的假三元组集合S'={<h',r,t>|h'∈E∪<h,r,t'>|t'∈E。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710827452.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种具有较长使用寿命的挂钩
- 下一篇:一种便于稳固的刹车线