[发明专利]显式和隐式兴趣知识的提取方法有效
| 申请号: | 201510493215.6 | 申请日: | 2016-01-11 |
| 公开(公告)号: | CN105589916B | 公开(公告)日: | 2020-05-08 |
| 发明(设计)人: | 杜亚军;彭彪;孟庆瑞;李曦 | 申请(专利权)人: | 西华大学;西藏飞跃智能科技有限公司 |
| 主分类号: | G06F16/953 | 分类号: | G06F16/953 |
| 代理公司: | 深圳市科吉华烽知识产权事务所(普通合伙) 44248 | 代理人: | 胡吉科 |
| 地址: | 610000 四川*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 兴趣 知识 提取 方法 | ||
本发明涉及网络搜索领域,其公开了一种社交网络中用户显式和隐式兴趣知识的提取方法,包括以下步骤:(A)计算用户之间的相似度;(B)文本实体的提取;(C)构建用户相似度向量及兴趣知识矩阵;(D)获取用户的兴趣知识。本发明的有益效果是:本发明用户的社交网络,根据社交网络中用户之间的结构相似度,提出了一种基于社交网络链路结构的用户相似度计算方法,用于构建用户的高相似度社交网络;实现了在社交平台上对用户兴趣知识的挖掘与发现,确保了数据来源的确定性与高相关性。
【技术领域】
本发明涉及网络搜索领域,尤其涉及一种提取显式和隐式兴趣知识的方法。
【背景技术】
用户的兴趣提取是指在社交平台中,通过用户在社交平台上的文字活动,挖掘出与用户相关的兴趣爱好;据《东方早报》报道,2014年是微博活跃用户增幅最快的一年。截至2014年四季度末,微博月活跃用户达到1.76亿,全年净增4700万,为推出以来的最高纪录;月活跃用户中来自移动端的比例高达80%。其中去年下半年用户增长速度更为迅速。伴随着互联网时代的到来,网络社交已经成为交友的新的趋势,基于社交网络的数据挖掘是运营商了解用户的一种重要的途径。在微博这种基于短文本的社交网络中,由于微博信息很短,这些文字不像长文本能反应用户的具体兴趣点,同时在用户长期发表的微博本文中,其中只有很少量的微博文本能反应用户的兴趣点。所以通过文字来挖掘用户信息有着较高的技术难点,微博中用户的兴趣挖掘是社交平台运营商了解用户的重要途径之一,是通过社交平台进一步进行商业运作的基础,充分挖掘用户的社交网络信息并分析他们的兴趣爱好,是社交平台运营商盈利的关键。因此有效的微博用户兴趣提取算法是确保社交平台运营情况的核心技术。
在发明专利“一种基于标签的社交网络用户兴趣挖掘方法与装置”(专利申请号:201210249582.8)中提出了一种基于社交网络用户标签的用户兴趣挖掘方法与装置,该方法通过用户在社交网络上生成的文字性数据包含的所有标签和每个标签所对应地权重构成用户的兴趣序列,从而达到用户兴趣挖掘的目的。但是在这一技术中,“一种基于标签的社交网络用户兴趣挖掘方法与装置”(专利申请号:201210249582.8)提出的社交网络用户兴趣挖掘方法与装置,建立在以用户生成的文本基础之上。该方法通过用户的兴趣标签作为挖掘用户兴趣的依据,不能挖掘出用户潜在的兴趣知识。同时,当用户文字信息较少的时候将无法有效、准确地挖掘出用户的兴趣爱好。只有当用户的文字信息达到一定数量时该方法才有可能挖掘用户感兴趣的知识。
在发明专利“社交网络用户兴趣挖掘方法和系统”(专利申请号:201410062761.X)中提出一种基于用户群组的社交网络用户兴趣挖掘方法,该方法通过分析用户的兴趣广义组对应的兴趣类别,从中挖掘用户的兴趣。该专利所提出的基于兴趣类别的社交网络用户兴趣挖掘方法和系统,建立在用户关注对象分类的基础之上。该方法需要首先将用户的关注对象分类,这一过程需要消耗相当多的时间,不能快速、有效地挖掘出用户的兴趣知识。其次该方法只能挖掘与用户显式的兴趣爱好,不能挖掘出用户未提及的潜在兴趣知识,限制了对用户兴趣知识挖掘的全面性。在论文“Mining the interests of Chinesemicrobloggers via keyword extration”(Z.Y.Liu,X.X.Chen,M.S.Sun.Frontiers ofComputer Science,2012,1(6),76-87.)中提出了一种基于词频统计和传统关键词提取方法相结合的用户兴趣挖掘算法,该算法通过对上述两种算法的结果合并来挖掘出用户的兴趣。该算法只能从当前用户已经发表的微博文本中挖掘用户的显式兴趣,但无法发现用户潜在的兴趣知识。
【发明内容】
为了解决现有技术中的问题,本发明提供了一种热点人物提取方法,解决了现有技术无法充分、有效挖掘社交平台中用户的兴趣爱好,无法满足运营商搜集用户需求这一难点问题。
本发明提供了一种显式和隐式兴趣知识的提取方法,包括以下步骤:(A)计算用户之间的相似度;(B)文本实体的提取;(C)构建用户相似度向量及兴趣知识矩阵;(D)获取用户的兴趣知识。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西华大学;西藏飞跃智能科技有限公司,未经西华大学;西藏飞跃智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510493215.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:网络文本的情感信息检测方法和装置
- 下一篇:数据可视化实现系统及方法





