[发明专利]一种组织成员兴趣爱好挖掘方法有效
申请号: | 201810558855.4 | 申请日: | 2018-06-01 |
公开(公告)号: | CN108829793B | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 周佳勇;司华友;万健;陈志辉;吴浩鹏;孙文 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F40/216;G06F40/247;G06F40/289;G06Q50/00 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 王桂名 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 组织 成员 兴趣爱好 挖掘 方法 | ||
本发明涉及一种组织成员兴趣爱好挖掘方法,包括以下步骤:从推文中提取出现频率较高的多个原始兴趣项;按照原始兴趣项的频率进行排序,原始兴趣项出现的频次为其原始权重;根据兴趣关联规则得到高频兴趣项的关联兴趣项集合;逐一提取原始兴趣项,若某个原始兴趣项满足关联规则且在关联兴趣项集合存在一个关联兴趣项,且该关联兴趣项与另一个原始兴趣项相同,则增加另一个原始兴趣项的权重;对处理后的原始兴趣项按照权重重新进行排序,提取前几个原始兴趣项作为该组织成员的兴趣项。通过本方法挖掘的兴趣爱好的查全率和查准率均得到提高,挖掘效果更好。
技术领域
本发明涉及数据挖掘技术领域,尤其涉及一种组织成员兴趣爱好挖掘方法。
背景技术
随着互联网的迅猛发展及普及,互联网组织成员的使用习惯已从最初的自己寻找内容转变为依赖服务方给予的内容推送,因此精确地了解每个组织成员兴趣点,能有效帮助服务方提供个性化的服务,提高组织成员的使用体验。
在兴趣爱好挖掘方面,Deng L等提出一种基于标签和双向交互的算法来挖掘中国最大的社交服务之一新浪微博的组织成员的话题兴趣。该算法通过组织成员交互图的制定,充分地利用了组织成员之间的相互作用的差异,结果表明,该算法在准确率和召回率方面优于其他方法,能够有效挖掘组织成员对标签和双向交互的兴趣。
Vu T等构建了一个从Twitter(一家美国社交网络及微博客服务的网站)消息中提取组织成员兴趣的系统,该系统使用语言模式提取感兴趣的候选项,并使用四种不同的关键词排序技术对其进行排序:TF-IDF,Text Rank,LDA-Text Rank和RI-Rank。结果表明TF-IDF和Text Rank都适合从推文中提取组织成员兴趣。
Bao H等提出了一个基于时间和社交概率矩阵分解模型来预测组织成员在博文中的潜在兴趣。该模型分析了时间信息和组织成员活动对组织成员潜在特征空间及其兴趣主题的影响,提供了融合时间信息和社交网络结构的统一方式,以准确预测组织成员未来的兴趣。
这些互联网组织成员兴趣挖掘的方法分别基于访问日志,微博或博客的浏览内容和行为。但是,现有的研究工作很少涉及兴趣爱好本身的内在关系及这些内在关系在兴趣爱好挖掘中的应用。
发明内容
本发明的目的在于针对现有技术中存在的缺陷,提出组织成员兴趣爱好挖掘方法。为了达到目的,本发明提供的技术方案为:
本发明涉及的一种组织成员兴趣爱好挖掘方法,包括以下步骤:
(1)从社交网站所有组织成员的个人档案中整理出多个高频兴趣项,并从某个组织成员的推文中挖掘n个与高频兴趣项相同的兴趣项作为原始兴趣项,n为大于1的整数;
(2)根据原始兴趣项的出现频次,对原始兴趣项排序,形成原始兴趣项列表,记为ittsSet 1~ittsSet n,形成原始兴趣项集合,ittsSet 1~ittsSet n对应的原始兴趣项初始权重w分别为w 1~w n,w 1~w n为对应的原始兴趣项的出现频次;
(3)根据兴趣爱好关联规则分析高频兴趣项的关联性,形成关联兴趣项集合ruleSet 1~ruleSet m,m为大于1的整数;
(4)逐一提取原始兴趣项ittsSet x,若其存在关联兴趣项,该关联兴趣项存在于关联兴趣项集合中,记为ruleSet y,且该关联兴趣项ruleSet y与另一个原始兴趣项ittsSet x’相同,则增加原始兴趣项ittsSet x’的权重为W,x和x’为1~n中的任一整数且互不相等,y为1~m中的任一整数,其余原始兴趣项的权重保持不变;
(5)根据新的权重重新排列原始兴趣项的顺序,得到该组织成员兴趣项列表,选取权重最大的一个或多个兴趣项作为该组织成员的兴趣项。
优选地,所述的步骤1中采用分词算法从所有组织成员个人档案中的整理高频兴趣项。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810558855.4/2.html,转载请声明来源钻瓜专利网。