[发明专利]一种基于朴素贝叶斯分类的节日情感分析方法在审
申请号: | 201910975850.6 | 申请日: | 2019-10-15 |
公开(公告)号: | CN110727798A | 公开(公告)日: | 2020-01-24 |
发明(设计)人: | 宋禹幡;胡建路;原慧琳 | 申请(专利权)人: | 东北大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/953;G06K9/62 |
代理公司: | 21212 大连东方专利代理有限责任公司 | 代理人: | 李馨 |
地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 微博 朴素贝叶斯分类器 自然语言处理技术 情感分析 权重分配 商业营销 影响用户 舆情分析 贝叶斯 分类 转发 评论 | ||
1.一种基于朴素贝叶斯分类的节日情感分析方法,其特征在于,包括如下步骤:
步骤一、根据预分析节日的发生日期以及与其相关的关键字/词采集用户的多维度原始数据,对采集到的原始数据进行预处理;
步骤二、基于政策因素分析积极情感占比,具体地,将预处理后的数据按照该节日的日期以及该节日往年信息通过朴素贝叶斯分类,进行积极情感占比分析;
步骤三、基于明星效应因素分析积极情感占比,其中,所述明星为微博官方的热度统计数据中热度达到预设指标的用户,具体地,选取预设指标综合评定后,热度排名靠前的多名明星微博的预处理后的数据,通过朴素贝叶斯分类,进行积极情感占比分析;基于预先给定函数对多维度数据中的待分析内容构建影响力模型,进而计算该明星微博内容的影响力,所述预设指标包括转发、评论和点赞的互动数量;
步骤四、基于步骤二、步骤三的结论绘制可视化图表,分析影响用户情感获取的实质因素。
2.根据权利要求1所述的基于朴素贝叶斯分类的节日情感分析方法,其特征在于,所述步骤一中,通过爬虫获取数据,具体包括:执行必要的请求参数,包括请求头和查询参数;将目标节日的日期和关键字设置为查询参数,抓取数据直接利用“请求”提供的方法将json数据转换为Python dictionary对象,从中提取所有文本字段的值,并将其放入博客列表中;所述多维度原始数据包括用户ID、昵称、会员信息、微博、微博标签、转发数、评论数、“赞”数。
3.根据权利要求1或2所述的基于朴素贝叶斯分类的节日情感分析方法,其特征在于,所述步骤二、步骤三中,通过调用Snow-NLP对微博文本进行情感分析,读取爬虫获取的数据,然后执行单词分割和去停词操作。
4.根据权利要求3所述的基于朴素贝叶斯分类的节日情感分析方法,其特征在于,所述步骤三中,基于如下给定函数计算该明星微博内容的影响力:
其中,w1、w2分别表示转发及评论数所占的权重,分别设为0.3、0.3,w3为点赞数的权重,设为0.4,bi表示微博的转发评论及点赞分别的数量。
5.根据权利要求4所述的基于朴素贝叶斯分类的节日情感分析方法,其特征在于,根据明星影响力得分与相应年度微博标准化用户数之比,可以得到客观的明星微博影响力,具体地,采用Min-Max归一化方法对微博用户群进行归一化,对网络大小进行标准化,结果映射为[0,1]:
其中xmax为样本数据的最大值,xmin为样本数据的最小值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910975850.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:标签生成方法、装置、电子设备和计算机可读介质
- 下一篇:本体构建方法及装置