[发明专利]基于社交网络的人物搜索和发现方法及系统有效
| 申请号: | 201310173156.5 | 申请日: | 2013-05-10 |
| 公开(公告)号: | CN103218457A | 公开(公告)日: | 2013-07-24 |
| 发明(设计)人: | 梁斌;刘奕群;马少平;张敏;金奕江;张阔;茹立云 | 申请(专利权)人: | 清华大学;北京搜狗科技发展有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张大威 |
| 地址: | 100084 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 社交 网络 人物 搜索 发现 方法 系统 | ||
1.一种基于社交网络的人物搜索和发现方法,其特征在于,包括以下步骤:
S1:从社交网络获取用户信息,其中,所述用户信息包括关注信息;
S2:对所述用户信息进行扩展以获得扩展标签;
S3:对所述关注信息进行预测以获得预测标签;
S4:根据所述用户信息、扩展标签和预测标签生成倒排索引;
S5:接收用户通过客户端输入的搜索信息,并根据所述搜索信息从所述倒排索引查找与所述搜索信息对应的用户;以及
S6:将搜索到的用户的用户信息反馈至所述客户端。
2.如权利要求1所述的基于社交网络的人物搜索和发现方法,其特征在于,当所述用户信息包括标签时,根据所述用户信息、标签、扩展标签和预测标签以生成倒排索引。
3.如权利要求1所述的基于社交网络的人物搜索和发现方法,其特征在于,所述步骤S3具体包括:
从所述用户信息中的好友中确定多个好友;
计算所述多个好友的权重,并从中选取根据权重值从大到小的排序前多个好友作为亲密好友;
从所述多个亲密好友的信息中获取多个标签;以及
根据所述多个标签的标签积分对所述多个标签进行筛选,以得到所述预测标签。
4.如权利要求1所述的基于社交网络的人物搜索和发现方法,其特征在于,所述倒排索引的排序结果是根据对应的用户粉丝数降序的顺序排序的。
5.如权利要求1所述的基于社交网络的人物搜索和发现方法,其特征在于,所述标签积分通过如下公式进行,所述公式为,
位置i的权重*标签在该位置i上出现次数,
其中,k为亲密好友的个数。
6.一种基于社交网络的人物搜索和发现系统,其特征在于,包括:
获取模块,用于服务器通过网络爬虫从社交网络获取用户信息,其中,所述用户信息包括关注信息;
扩展模块,用于服务器对所述用户信息进行扩展以获得扩展标签;
预测模块,用于服务器对所述关注信息进行预测以获得预测标签;
索引模块,用于服务器根据所述用户信息、扩展标签和预测标签生成倒排索引;
查找模块,用于服务器接收用户通过客户端输入的搜索信息,并根据所述搜索信息从所述倒排索引查找与所述搜索信息对应的用户;以及
反馈模块,用于服务器将搜索到的用户的用户信息反馈至所述客户端。
7.如权利要求6所述的基于社交网络的人物搜索和发现系统,其特征在于,当所述用户信息包括标签时,服务器根据所述用户信息、标签、扩展标签和预测标签以生成倒排索引。
8.如权利要求6所述的基于社交网络的人物搜索和发现系统,其特征在于,所述预测模块具体包括:
确定单元,用于服务器从所述用户信息中的好友中确定多个好友;
计算单元,用于服务器计算所述多个好友的权重,并从中选取根据权重值从大到小排序的前多个好友作为亲密好友;
获取单元,用于服务器从所述多个亲密好友的信息中获取多个标签;以及
筛选单元,用于服务器根据所述多个标签的标签积分对所述多个标签进行筛选,以得到所述预测标签。
9.如权利要求6所述的基于社交网络的人物搜索和发现系统,其特征在于,所述倒排索引的排序结果是根据对应的用户粉丝数降序的顺序排序的。
10.如权利要求6所述的基于社交网络的人物搜索和发现系统,其特征在于,所述标签积分通过如下公式进行,所述公式为,
位置i的权重*标签在该位置i上出现次数,
其中,k为亲密好友的个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;北京搜狗科技发展有限公司,未经清华大学;北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310173156.5/1.html,转载请声明来源钻瓜专利网。





