[发明专利]基于社交网络的人物搜索和发现方法及系统有效
| 申请号: | 201310173156.5 | 申请日: | 2013-05-10 |
| 公开(公告)号: | CN103218457A | 公开(公告)日: | 2013-07-24 |
| 发明(设计)人: | 梁斌;刘奕群;马少平;张敏;金奕江;张阔;茹立云 | 申请(专利权)人: | 清华大学;北京搜狗科技发展有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张大威 |
| 地址: | 100084 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 社交 网络 人物 搜索 发现 方法 系统 | ||
技术领域
本发明涉及信息搜索技术领域,特别涉及一种基于社交网络的人物搜索和发现方法及系统。
背景技术
随着网络技术的不断提高对信息的分析、提取和处理的速度成倍提升,由此满足了用户的各种需求。
目前人物搜索中普遍采用的是专家搜索和找人搜索。其中,专家搜索是在互联网海量的异构数据中,寻找用户,并进行排序。另外,找人搜索是通过提供更多的信息,准确的找到符合要求的人。例如,雅虎的人物搜索(people.yahoo.com)是通过用户提供的电话号码,姓名,所在城市,在社交网络中(Facebook,twitter)找到具体的符合要求的人。
现有技术存在如下缺点:
(1)现有的专家系统没用利用社交网络的信息,专家数量少。
(2)现有的专家系统利用论文发表的情况,老专家占优,新专家吃亏。
(3)现有的专家系统使用的是论文引用的关系,文本对专家姓名的提及,都无法适用于社交网络这种短文本,快速交流,大量关注关系的场合。
发明内容
本发明的目的旨在至少解决上述的技术缺陷之一。
为此,本发明的一个目的在于提出一种基于社交网络的人物搜索和发现方法。
本发明的另一目的在于提出一种基于社交网络的人物搜索和发现系统。
为达到上述目的,本发明一方面的实施例提出一种基于社交网络的人物搜索和发现方法,包括以下步骤:S1:从社交网络获取用户信息,其中,所述用户信息包括关注信息;S2:对所述用户信息进行扩展以获得扩展标签;S3:对所述关注信息进行预测以获得预测标签;S4:根据所述用户信息、扩展标签和预测标签生成倒排索引;S5:接收用户通过客户端输入的搜索信息,并根据所述搜索信息从所述倒排索引查找与所述搜索信息对应的用户;以及S6:将搜索到的用户的用户信息反馈至所述客户端。
本发明的一个实例中,当所述用户信息包括标签时,根据所述用户信息、标签、扩展标签和预测标签以生成倒排索引。
本发明的一个实例中,所述步骤S3具体包括:从所述用户信息中的好友中确定多个好友;计算所述多个好友的权重,并从中选取根据权重值从大到小的排序前多个好友作为亲密好友;从所述多个亲密好友的信息中获取多个标签;以及根据所述多个标签的标签积分对所述多个标签进行筛选,以得到所述预测标签。
本发明的一个实例中,所述倒排索引的排序结果是根据对应的用户粉丝数降序的顺序排序的。
本发明的一个实例中,所述标签积分通过如下公式进行,所述公式为,
位置i的权重*标签在该位置i上出现次数,
其中,k为亲密好友的个数。
根据本发明实施例的方法,通过对社交网络中的用户信息进行扩展和预测,并建立倒排索引实现用户搜索信息的查询,方便用户使用。
为达到上述目的,本发明的实施例另一方面提出一种基于社交网络的人物搜索和发现系统,包括:获取模块,用于服务器通过网络爬虫从社交网络获取用户信息,其中,所述用户信息包括关注信息;扩展模块,用于服务器对所述用户信息进行扩展以获得扩展标签;预测模块,用于服务器对所述关注信息进行预测以获得预测标签;索引模块,用于服务器根据所述用户信息、扩展标签和预测标签生成倒排索引;查找模块,用于服务器接收用户通过客户端输入的搜索信息,并根据所述搜索信息从所述倒排索引查找与所述搜索信息对应的用户;以及反馈模块,用于服务器将搜索到的用户的用户信息反馈至所述客户端。
本发明的一个实例中,当所述用户信息包括标签时,服务器根据所述用户信息、标签、扩展标签和预测标签以生成倒排索引。
本发明的一个实例中,所述预测模块具体包括:确定单元,用于服务器从所述用户信息中的好友中确定多个好友;计算单元,用于服务器计算所述多个好友的权重,并从中选取根据权重值从大到小排序的前多个好友作为亲密好友;获取单元,用于服务器从所述亲密好友的信息中获取多个标签;以及筛选单元,用于服务器根据所述多个标签的标签积分对所述多个标签进行筛选,以得到所述预测标签。
本发明的一个实例中,所述倒排索引的排序结果是根据对应的用户粉丝数降序的顺序排序的。
本发明的一个实例中,所述标签积分通过如下公式进行,所述公式为,
位置i的权重*标签在该位置i上出现次数,
其中,k为亲密好友的个数。
根据本发明实施例的系统,通过对社交网络中的用户信息进行扩展和预测,并建立倒排索引实现用户搜索信息的查询,方便用户使用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;北京搜狗科技发展有限公司,未经清华大学;北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310173156.5/2.html,转载请声明来源钻瓜专利网。





