[发明专利]基于社交媒体内容的关键用户挖掘方法、系统及装置在审

专利信息
申请号: 202011363444.3 申请日: 2020-11-27
公开(公告)号: CN112487264A 公开(公告)日: 2021-03-12
发明(设计)人: 不公告发明人 申请(专利权)人: 上海蜜度信息技术有限公司
主分类号: G06F16/906 分类号: G06F16/906;G06F16/9536;G06Q50/00
代理公司: 上海光华专利事务所(普通合伙) 31219 代理人: 邬嫡波
地址: 201204 上海市浦东新区中国(上*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 社交 媒体 内容 关键 用户 挖掘 方法 系统 装置
【说明书】:

发明提供一种基于社交媒体内容的关键用户挖掘方法、系统及装置,包括:基于关键词获取预设时间段的微博,基于分类模型对所述微博进行分类,获取特定人群的微博;对特定人群的微博基于时间维度和特征维度建立对应关系,获取特征维度高于预设值的对应的时间窗口,获取时间窗口对应的微博;基于LDA模型对所述时间窗口对应的微博进行主题分类,获得进行主题分类后的微博,获得所述主题分类后的每条微博对应所属类别的概率,设定类别的概率阈值,获取最大概率大于所述类别的概率阈值的各个主题下的微博,获取所述各个主题下的微博对应的用户;对所述用户分别基于意见领袖挖掘算法计算,得到用户的影响力指数。本发明用于挖掘特定人群的微博意见领袖。

技术领域

本发明涉及数据分析技术领域,特别是涉及一种基于社交媒体内容的关键用户挖掘方法、系统及装置。

背景技术

现有的意见领袖挖掘算法包括:

基于pagerank/leaderank的意见领袖挖掘:PageRank,又称网页排名、谷歌左侧排名、PR,是Google公司所使用的对其搜索引擎搜索结果中的网页进行排名的一种算法。PageRank排名本质上是一种以网页之间的超链接个数和质量作为主要因素粗略地分析网页的重要性的算法。其基本假设是:更重要的页面往往更多地被其他页面引用(或称其他页面中会更多地加入通向该页面的超链接)。

Leaderrank算法是基于pagerank算法提出的,并最初应用于在线社会标签网的一种用户排序算法。Leaderank算法的基本思想是在整个网络已有节点外另加一个背景节点,并且将它与已有的所有节点双向连接,于是得到N+1个节点的网络,这个网络是一个强连通的网络,再按照原始的pagerank算法计算得到原来N个节点的重要性排序。

QMOLA算法:QMOLA算法是一种基于主题相似度的多标签均衡社团划分算法和快速意见领袖挖掘算法QMOLA。首先采用I-LDA计算主题分布,并籍此计算出主题相似度。并利用主题相似度排序,确定节点标签传播更新的顺序,再结合邻居节点间的社团标签信息更新自身的社团标签信息,由此划分出高稳定性的主题社团;然后针对某一主题社团,根据结构特征排除粉丝数、关注数和VIP等级较低的用户,确定候选人集合;最后,根据候选人的传播特征和情感特征计算用户影响力,挖掘TOP-K个意见领袖。

基于pagerank/leaderank的意见领袖挖掘注重考虑用户和用户间的交互特征,对于用户自身的如关注人群性质、自身发文特征,未考虑。

QMOLA算法一定程度上解决基于pagerank/leaderank的意见领袖挖掘方法,但在针对特征人群相关文本的原始处理上未有涉及,情感特征单使用关键词的词向量平均值作为句向量特征过于笼统。

本申请加入原始文本处理方式,对情感特征使用情绪分类作为辅助。从而更好的达到挖掘效果。

意见领袖,是指在人际传播网络中经常为他人提供信息,同时对他人施加影响的“活跃分子”,他们在大众传播效果的形成过程中起着重要的中介或过滤的作用,由他们将信息扩散给受众,形成信息传递的两级传播。而微博意见领袖是指微博用户中的意见领袖。由于微博意见领袖的影响力大,那么如何及时识别微博意见领袖,从而引导信息传输。

因此,希望能够解决如何更好地进行微博意见领袖挖掘的问题。

发明内容

鉴于以上所述现有技术的缺点,本发明的目的在于提供一种基于社交媒体内容的关键用户挖掘方法、系统及装置,用于解决现有技术中如何更好地进行微博意见领袖挖掘的问题。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海蜜度信息技术有限公司,未经上海蜜度信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011363444.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top