[发明专利]一种舆情事件中社交媒体用户角色分类方法有效
| 申请号: | 202110400483.4 | 申请日: | 2021-04-14 | 
| 公开(公告)号: | CN113076489B | 公开(公告)日: | 2022-09-13 | 
| 发明(设计)人: | 孙春华;周凡;李怡;孙见山;周永行;井二康;梁瑞成;陶守正;魏雪梅 | 申请(专利权)人: | 合肥工业大学 | 
| 主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06Q50/00 | 
| 代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 陆丽莉;何梅生 | 
| 地址: | 230009 安*** | 国省代码: | 安徽;34 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 舆情 事件 社交 媒体 用户 角色 分类 方法 | ||
本发明公开了一种舆情事件中社交媒体用户角色分类方法,其步骤包括:1.获取社交媒体中的用户信息,并提取用户特征,2.设计非参贝叶斯模型混合狄利克雷过程混合模型(h‑DPMM)建模用户角色,3.设计吉布斯采样推断参数,分析舆情事件中社交媒体的用户角色,本发明能够利用在线社交媒体平台中用户生成的内容将用户为不同的角色,从而实现对群体中角色类型全面快速且精准地分类。
技术领域
本发明涉及在线社交媒体中角色分类技术领域,具体涉及一种舆情事件中社交媒体用户角色分类方法。
背景技术
在线社交媒体平台极大的丰富了人们产生、分享和消费知识与信息的方式,成为人们生产和传播信息的主要媒介。研究表明,用户生成内容是表达自身兴趣与态度等内在特质的重要手段。同时,用户产生内容也展示了用户自身的生活习惯与在整个社会化网络平台中的角色。对用户进行角色分类对社交网络中不同类型的用户进行分类具有重要意义。
现有技术对在线媒体中用户进行角色分类时,大多依据用户的行为数据进行角色分类,忽略了用户的生成内容,没有综合利用用户生成内容以及用户行为数据这两种重要的反映用户角色的信息,导致角色类型划分不够准确;与此同时,现有的角色分类方法需要预定义角色的数量,但是随着社交网络的发展,预定义角色的数量为角色分类带来了很大的困难;此外,现有模型多将每个用户视为具有相同特征结构的单个数据点,其中每个用户的特征信息并不包含任何用户行为或其他属性的信息,因此它不足以分析社交媒体中大量的行为数据。
发明内容
本发明为了克服现有技术存在的不足之处,提出一种舆情事件中社交媒体用户角色分类方法,以期能结合社交媒体中用户的生成内容和用户行为进行用户角色分类,从而能够自动确定社交网络中的真实角色数量,提高社交网络中用户分类的全面性、准确性和精确性。
本发明为达到上述发明目的,采用如下技术方案:
本发明一种舆情事件中社交媒体用户角色分类方法的特点是按如下步骤进行:
步骤1、获取社交媒体中的用户信息:
步骤1.1、构建用户集合U∈{1,2,…,u…,|U|},其中,u表示用户的序号,|U|表示社交媒体中用户的数量;
步骤1.2、获取社交媒体中|U|个用户的行为数据,其中,所述用户集合U中第u个用户的行为数据包括:第u个用户关注的用户数量关注第u个用户的用户数量以及第u个用户发布的文本数量Mu;
步骤1.3、获取社交媒体中|U|个用户发布的文本信息,并去除所有停用词后,构成文本集合;其中,第u个用户去除停用词后所对应的文本信息,记为Wu,n表示第u个用户的文本信息中第n个词,Nu表示文本信息中的词总数;
步骤2、基于社交媒体中用户的行为数据和文本信息,构建非参贝叶斯模型-混合狄利克雷过程混合模型h-DPMM:
步骤2.1、对于社交媒体中的第u个用户,按照式(1)生成第u个用户对应的角色ru:
ru~Multinomial(π),π~Dirichlet(α) (1)
式(1)中,~表示服从,Multinomial(·)表示多项式分布,Dirichlet(·)表示狄利克雷分布,π表示多项式分布的超参数,α表示狄利克雷分布的超参数;
步骤2.2、对于社交媒体中的第u个用户,按照式(2)生成第u个用户的主题分布θu:
θu~Multinomial(ρk),ρk~Dirichlet(α1) (2)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110400483.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:过滤网筒及随手吸尘器
- 下一篇:一种浸没式散热系统





