[发明专利]一种基于情感分析的数据处理方法和装置在审
申请号: | 201711277819.2 | 申请日: | 2017-12-06 |
公开(公告)号: | CN107908782A | 公开(公告)日: | 2018-04-13 |
发明(设计)人: | 李哲君;卫华飞;刘欢;程瑞辉 | 申请(专利权)人: | 陕西识代运筹信息科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27;G06K9/62 |
代理公司: | 北京众达德权知识产权代理有限公司11570 | 代理人: | 刘杰 |
地址: | 710065 陕西省西安市*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 情感 分析 数据处理 方法 装置 | ||
技术领域
本发明涉及信息处理技术领域,尤其涉及一种基于情感分析的数据处理方法和装置。
背景技术
现有技术中常用的计算平台中的数据具有海量性、实时性和动态变化性的特点,所以数据平台的处理任务大小也具备动态变化特征,同样企业中对于数据流计算的查询也是动态变化的。
但本申请发明人在实现本申请实施例中发明技术方案的过程中,发现上述技术至少存在如下技术问题:
现有技术无法实现对实时网络数据流快速、准确的情感分析的技术问题。
发明内容
本发明实施例提供了一种基于情感分析的数据处理方法和装置,解决了现有技术中无法实现对实时网络数据流快速、准确的情感分析的技术问题。
鉴于上述问题,提出了本申请实施例以便提供一种基于情感分析的数据处理方法和装置。
第一方面,本发明提供了一种基于情感分析的数据处理方法,所述方法包括:获得原始文本数据库,所述原始文本数据库中包含文本数据;获得情感分析词典;根据所述情感分析词典,获得第一情感权值;获得在线序列-极限学习机模型;根据所述在线序列-极限学习机模型,动态调整预测模型,获得第二情感权值;根据所述第一情感权值、所述第二情感权值,确定所述第三情感权值。
结合第一方面,在第一方面的第一种可能的实现方式中,所述根据所述情感分析词典,获得第一情感权值,具体包括:根据所述情感分析词典,获得情感分数;根据所述情感分数,判断情感极性;根据所述文本数据,获得第一词语集合;去除所述第一词语集合中的停留词,获得第二词语集合;根据所述情感分数、所述情感极性、所述第二词语集合,获得所述第一情感权值。
结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,所述根据所述情感分数,判断情感极性,具体包括:如果所述情感分数大于零,判断所述情感极性为正;如果所述情感分数小于零,判断所述情感极性为负。
结合第一方面的第一种可能的实现方式,在第一方面的第三种可能的实现方式中,所述第二词语集合包括否定词和/或程度副词和/或情感词。
结合第一方面,在第一方面的第四种可能的实施方式中,所述根据所述在线序列-极限学习机模型,动态调整预测模型,获得第二情感权值,具体包括:根据所述文本数据,获得第三词语集合;去除所述第三词语集合中的停留词,获得第四词语集合;根据所述第四词语集合,获得词向量;获得所述词向量的主成分;获得在线序列-极限学习机模型;根据所述主成分、所述在线序列-极限学习机模型,动态调整预测模型,获得第二情感权值。
结合第一方面,在第一方面的第五种可能的实施方式中,所述根据所述第一情感权值、所述第二情感权值,确定所述第三情感权值,具体包括:根据所述情感分析词典,获得情感参数;根据所述情感参数、所述第一情感权值、所述第二情感权值,确定所述第三情感权值。
结合第一方面的第五种可能的实施方式,在第一方面的第六种可能的实施方式中,所述情感参数范围为0~1。
第二方面,本发明提供了一种基于情感分析的数据处理装置,所述装置包括:第一获得单元,所述第一获得单元用于获得原始文本数据库,所述原始文本数据库中包含文本数据;第二获得单元,所述第二获得单元用于获得情感分析词典;第三获得单元,所述第三获得单元用于根据所述情感分析词典,获得第一情感权值;第四获得单元,所述第四获得单元用于获得在线序列-极限学习机模型;第五获得单元,所述第五获得单元用于根据所述在线序列-极限学习机模型,动态调整预测模型,获得第二情感权值;第一确定单元,所述第一确定单元用于根据所述第一情感权值、所述第二情感权值,确定所述第三情感权值。
结合第二方面,在第二方面的第一种可能的实现方式中,所述第三获得单元具体包括:第六获得单元,所述第六获得单元用于根据所述情感分析词典,获得情感分数;第一判断单元,所述第一判断单元用于根据所述情感分数,判断情感极性;第七获得单元,所述第七获得单元用于根据所述文本数据,获得第一词语集合;第八获得单元,所述第八获得单元用于去除所述第一词语集合中的停留词,获得第二词语集合;第九获得单元,所述第九获得单元用于根据所述情感分数、所述情感极性、所述第二词语集合,获得所述第一情感权值。
结合第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式中,所述第一判断单元具体包括:第二判断单元,所述第二判断单元用于如果所述情感分数大于零,判断所述情感极性为正;第三判断单元,所述第三判断单元用于如果所述情感分数小于零,判断所述情感极性为负。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西识代运筹信息科技股份有限公司,未经陕西识代运筹信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711277819.2/2.html,转载请声明来源钻瓜专利网。