[发明专利]一种用于社交网络社区挖掘的时空LDA模型在审
| 申请号: | 201510670779.2 | 申请日: | 2015-10-13 |
| 公开(公告)号: | CN105354244A | 公开(公告)日: | 2016-02-24 |
| 发明(设计)人: | 段炼 | 申请(专利权)人: | 广西师范学院 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/00 |
| 代理公司: | 成都九鼎天元知识产权代理有限公司 51214 | 代理人: | 陈科恒 |
| 地址: | 530001 广西壮族*** | 国省代码: | 广西;45 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明属于舆情监控领域,涉及社交网络用户推荐及服务推荐技术分析,尤其涉及一种用于社交网络社区挖掘的时空LDA模型。主要包括以下步骤:建立微博要素的表达式、对微博词汇制约的数学建模、微博时空主题模型建模及微博时空主题模型参数计算。本发明的有益效果是利用时间、空间、微博主题及用户间的交互共同进行社交网络社区的发现,提高了社区挖掘的有效性和准确性;从区域及社区的主题分布、微博地理位置和潜在地理区域空间范围控制微博与潜在地理区域的关系,不仅减少了空间上相互重叠或包含的潜在地理区域的产生,限制了潜在地理区域空间范围的无限增大,还能同时提高微博主题判别的准确性。 | ||
| 搜索关键词: | 一种 用于 社交 网络 社区 挖掘 时空 lda 模型 | ||
【主权项】:
一种用于社交网络社区挖掘的时空LDA模型,其特征在于,包括以下步骤:(1)建立微博要素的表达式:用于对微博进行概念模型的建模,其中表达式为:di=(W,t,l,r,u,c),其中W表示该微博词袋,包含于词汇总表V={w1,w2,…,w|V|},w1,w2,…,w|V|分别表示每个不同的词汇,t表示微博发布时间,l表示微博发布的地理位置,r表示微博所在潜在地理区域,u表示微博用户,c代表用户所在社区;(2)对微博词汇制约的数学建模:用于描述不同空间、社区对微博词汇的影响力大小,包括空间和社区对微博词汇制约的数学建模,所述模型表达式为:
其中,
表示存在背景主题‑词汇分布,
表示各潜在地理区域的主题‑词汇分布,
表示各社区的主题‑词汇分布;(3)微博时空主题模型建模:用于描述时间、区域及社区要素对微博的生成过程,所述微博主题的表达式为:P(z|c,r)=P(z|θ0,θr,θc)=Multi(z|θ0+θr+θc)其中,z表示已知主题,θ0表示背景主题分布,θr表示区域r的主题分布均值,θc表示社区c的主题分布;(4)微博时空主题模型参数计算:用于得到模型参数,从而确定用户属于社区的概率,基于最大期望算法方法和吉布斯采样法估计时空主题模型的参数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西师范学院,未经广西师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510670779.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种查询音视频文件的方法及装置
- 下一篇:一种文件编码方法及装置





