[发明专利]一种结合微博弱关系的微博情感分析方法在审
申请号: | 201810248802.2 | 申请日: | 2018-03-25 |
公开(公告)号: | CN108595515A | 公开(公告)日: | 2018-09-28 |
发明(设计)人: | 杨静;邹晓梅;张健沛;韩宏宇;张薇 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 微博 情感分析 矩阵 文本内容 最终模型 感染性 一致性关系 关系矩阵 文本分类 综合模型 分析器 正则化 情绪 算法 可信 社区 优化 | ||
本发明公开了一种结合微博弱关系的微博情感分析方法,属于文本分类技术领域,包含如下步骤:步骤(1):计算微博之间的情感一致性关系矩阵,建立基于情感一致性的微博情感分析模型;步骤(2):计算微博情绪感染性矩阵,建立基于情绪感染性的微博情感分析模型;步骤(3):使用社区划分算法,计算微博弱关系矩阵,建立基于微博弱关系的微博情感分析模型;步骤(4):结合步骤(1),步骤(2)和步骤(3),得到综合模型,然后加入基于微博文本内容的情感分析模型并正则化,得到最终模型;步骤(5):优化最终模型,解出微博情感分析器。本发明不仅利用了微博矩阵,还考虑了微博的文本内容,更加精确可信。
技术领域
本发明属于文本分类技术领域,尤其涉及一种结合微博弱关系的微博情感分析方法。
背景技术
《2010年中国互联网舆情分析报告》调查显示,2010年年度网络热点事件中关于“腾讯与360大战”话题,新浪微博的回复量达到260万条,“上海世博会”的相关评论也达到106万条,远远超过新闻报道、社区、论坛的数目。2011年7月23日温州动车事件,新浪微博相关评论达到282万,腾讯微博也有684万回复量。可见微博已经成为社会舆论传播的重要媒介之一,对微博进行情感分析,是掌握网民对突发事件的情感反馈的主要手段。
随着互联网技术的发展,大量新型的社交平台如Twitter、Sina、Weibo等随之出现,它们吸引着大量用户。用户在这些网站上发表大量的微博,包含着他们各种各样的观点。而分析用户观点在各个领域都有重要作用和意义例如,可以通过分析用户观点来对股市进行预测、提高推荐系统的准确率、调查用户对于产品的反馈、帮助政府部门进行舆情监督等。这个分析的用户观点的过程就称为情感分析。
情感分类方法可以分为两类:基于词典的分析方法和基于机器学习的方法。基于词典的分析方法利用情感词典如SentiWordNet,SenticNet等对句子中的词进行情感标记,整个文档的情感是对其句子的词的情感的综合。基于词典的情感分析方法是无监督的,并不需要事先标记的数据集,这种方法的缺点是过分依赖情感词典,且可移植性差,与分析领域有很大关联。基于机器学习的情感分析方法是将情感分析视为文本分类。这种方法从已经标记的文本中提取特征,然后对未知文本进行分类。这类方法通常需要大量的带标记的训练集,分类精度和训练集的规模有很大关系。
但由于这些新兴的社交网络的内容是由用户生成的,其表达方式各异,生成的句子简短,含有大量的噪音来干扰传统的情感分析方法。传统的单纯基于选择不同的文本特征的方法在这种新的情境下并不适用。这些方法假设各个文本之间是相互独立的,在社交网站上,这个假设并不成立,文本之间存在着各样的关系。
申请号为201310506561.4的专利微博中网络新词抽取方法和微博情感分析方法及系统,提及一种基于词汇抽取的微博情感分析方法,能有效对多元化情感进行表示。采用与临床心理学相结合的方法构建情感向量,并对微博数据流进行检测,自动发现并吸收能表示情感的网络新词来更新情感向量,不仅具有一定的权威性,同时也可以保证情感向量的全面性。建立情感向量的层次化结构,避免了情感向量的稀疏性;同时基于情感向量的层次结构,可对微博进行的多层次分析,能从不同角度反应公众对突发事件的情感态度。但该方法可移植性差,不能有效地应用于其他社交工具。
申请号为201410723617.6的专利,公开了一种融合显性和隐性特征的中文微博情感分析方法,该方法针对微博中的词汇,表情,符号,谐音词,简写词等进行细致分析。能够具体细致地分析出用户微博中包含的多重情感。但该方法可操作性差。且互联网时代,表情符号的情感归属难以划分或者变化迅速,使得情感分析结果可信度下降。
发明内容
本发明的目的在于公开适用范围广、可移植性强的一种结合微博弱关系的微博情感分析方法。
本发明的目的是这样实现的:
一种结合微博弱关系的微博情感分析方法,其特征在于:包含如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810248802.2/2.html,转载请声明来源钻瓜专利网。