[发明专利]用于对社交媒体的用户分类的方法、计算机程序和计算机有效
申请号: | 201480012959.5 | 申请日: | 2014-03-05 |
公开(公告)号: | CN105378717B | 公开(公告)日: | 2019-11-15 |
发明(设计)人: | 西山莉纱;吉田一星 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/35 |
代理公司: | 11247 北京市中咨律师事务所 | 代理人: | 于静;张亚非<国际申请>=PCT/JP2 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 社交 媒体 用户 分类 方法 计算机 程序 | ||
为了无需获取所有用户的内容就能根据内容相似性分类,提供一种用于聚类社交媒体中的多个用户的方法,其中将各个用户与一文本简档和文本内容相关联,该方法包含以下步骤:根据与一部分用户相关联的内容,为该部分用户的各个用户生成一个内容特征向量;根据内容特征向量,生成多个群集并且映射该多个群集与该部分用户;根据与映射到每个群集的该部分用户相关联的简档为该多个群集的各个群集生成第一简档特征向量;和根据与除该部分用户以外的其他用户相关联的简档和第一简档特征向量,把其他用户的各个用户划归入多个群集。
技术领域
本发明涉及信息处理技术,更具体来说,涉及更有效地识别社交媒体中的用户集合的技术。
背景技术
随着社交媒体的广泛使用,按“偏好和兴趣”为社交媒体用户分类,用于市场营销,越来越广为人知。例如,这些分类被用来识别用户有可能购买的产品和服务,以及分割大型用户集合(按照相似兴趣的分类)。已经有人尝试根据年龄和政治倾向相似的用户在社交媒体上发布相似内容的假设来识别用户集合。例如,有人已经努力过用内容相似性来估计用户的年龄和政治倾向(非专利文献1和非专利文献2),这些努力已经取得了一定的成功。用类似的技术来估计具有共同偏好和兴趣的用户集合被认为在理论上是可能的。
现有技术文献
专利文献
专利文献1:特许4,898,938号公报
专利文献2:特开2000-148864号公报
非专利文献
非专利文献1:Pennacchiotti,M.、Popescu,A.-M.,2011年,“Democrats,Republicans and Starbucks Afficionados:User Classification in Twitter,”Proceedings of the 17th ACM SIGKDD International Conference on KnowledgeDiscovery and Data Mining(KDD 2011),pp.430-438,2011.(“民主党人、共和党人和星巴克迷:推特中的用户分类”,第17届ACM SIGKDD知识发现和数据挖掘国际研讨会论文集,2011年,第430-438页)。
非专利文献2:Rao,D.、Yarowsky,D.、Shreevats,A.、Gupta,M.(2010),“Classifying Latent User Attributes in Twitter”Proceedings of the 2ndInternational Workshop on Search and Mining User-Generated Contents(SMUC2010),pp.37-44,2010.(“分类推特中的用户属性”,第二届用户生成内容的检索和挖掘国际研讨会论文集,2010年,第37-44页)。
非专利文献3:Twitter,“GET statuses/user_timeline”,[online],2013-02-12,Twitter[2013-02-25检索]。因特网URL<https://dev.twitter.com/docs/api/1.1/get/statuses/user_timeline>。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480012959.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据查询方法、装置及系统
- 下一篇:实体提取反馈