[发明专利]一种基于情感倾向分析的社交用户生成方法有效

专利信息
申请号: 202010895038.5 申请日: 2020-08-31
公开(公告)号: CN112084333B 公开(公告)日: 2022-04-22
发明(设计)人: 徐向华;胡杰;王然;李平 申请(专利权)人: 杭州电子科技大学
主分类号: G06F16/35 分类号: G06F16/35;G06F40/289;G06F40/30;G06K9/62;G06Q50/00
代理公司: 杭州君度专利代理事务所(特殊普通合伙) 33240 代理人: 朱亚冠
地址: 310018 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 情感 倾向 分析 社交 用户 生成 方法
【说明书】:

发明公开了一种基于情感倾向分析的社交用户生成方法。现有用户标签生成方法没有考虑用户对主题的情感倾向。本发明方法首先以微博内容为基础,采用聚类算法构建语义本体,获取用户的微博内容进行情感分类,将带有情感倾向标记的微博信息处理,得到词袋模型,提取词袋模型的词,利用语义本体获取类别信息,统计带有情感标记的类别信息,添加二级标签,得到最终标签,将人口统计信息映射到相应的标签中,构造网络图,根据网络图节点间的边权值大小半监督地生成用户。本发明方法解决了目前社交网络用户不能自动生成用户以及生成的用户标签不准确的问题,能够生成符合某一主题的社交用户,为后续的社会工程研究打下基础。

技术领域

本发明涉及计算机应用与互联网技术领域,特别是涉及一种基于社交网络文本情感倾向分析的用户生成方法。

背景技术

二十一世纪互联网技术得到飞速的发展,用户通过社交平台发布信息的方式变得多种多样,可以使用短信、邮件、实时软件以及网页来发布自己编辑的信息,使得社交平台上聚集了大量与个人隐私相关联的数据。通过研究和分析这些数据,可以挖掘出与用户相关的兴趣标签和对应的情感倾向。

社交媒体近年来的崛起已经改变了人们的生活方式。人们热衷在社交网络上关注自己的兴趣,分享自己的喜好,评论流行的趋势,这也给数据挖掘技术带来了很大价值,可以被挖掘很多的即时的、潜在的、有价值的知识与模式,这些信息可以被用于网络热点事件发现、网络民意调查、舆情监督、特定市场分析、销售策划等领域。社交用户行为模式近似于社区网站,其蕴含的结构化与半结构化数据中包含了很多可发现的内容。社交用户生成方法是为了抽象地表示特定的一组具有相似行为、属性或特征的消费者,每一个角色为了更接近真实,都有各自详细的描述,包括:用户名,年龄,性别,擅长领域等细节。在社交网络中存在大量的虚假用户和僵尸用户,一些网络黑客利用它们进行社会工程攻击和舆论控制,我们分析了虚假用户的生成以及它们如何进行社交活动,这些对于制定针对性防御计划有重大意义。

目前的社交用户生成方法较少,更多的是聚焦于用户标签的生成,并未将用户属性映射至构建好的标签库中,标签独立于用户而存在,没有对其进一步地研究利用。在标签构建方面,传统的方法将用户的推文构建词袋模型,映射到语义本体的类别上,收集标签信息,但是此类方法只能通过关键词数量来判断,并没有考虑用户对主题的情感倾向性。由于消极情绪的存在,会对一些主题爱好产生影响,因此干扰了生成用户的完整性,对后面用户分析形成很大的误导。

发明内容

本发明的目的是针对现有技术的不足,提供一种基于情感倾向分析的社交用户生成方法,利用大数据时代获取数据的便利性,通过提取用户基本资料、用户关系数据和用户微博,基于情感倾向分析不同用户群体的行为模式和兴趣爱好并建立用户标签,利用人口统计学分析用户群体的基本特征(年龄,性别,所在地),半监督式地生成社交用户。

为实现上述目标,本发明采用如下方案:

步骤(1).以微博内容为基础,采用聚类算法构建语义本体;

步骤(2).获取用户的微博内容并进行预处理,进行情感分类,得到带有情感倾向标记的微博信息;

步骤(3).将带有情感倾向标记的微博信息进一步处理,得到词袋模型;

步骤(4).提取词袋模型的词,利用语义本体获取类别信息;

步骤(5).采用投票策略统计带有情感标记的类别信息,添加二级标签,得到最终标签;

步骤(6).将人口统计信息映射到相应的标签中,构造网络图;

步骤(7).根据网络图节点间的边权值大小半监督地生成用户。

进一步,步骤(1)具体是:

(1.1).爬取用户微博T、用户关系R和用户信息U到数据库中;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010895038.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top