[发明专利]一种基于情感分析的数据处理方法和装置在审
申请号: | 201711277819.2 | 申请日: | 2017-12-06 |
公开(公告)号: | CN107908782A | 公开(公告)日: | 2018-04-13 |
发明(设计)人: | 李哲君;卫华飞;刘欢;程瑞辉 | 申请(专利权)人: | 陕西识代运筹信息科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27;G06K9/62 |
代理公司: | 北京众达德权知识产权代理有限公司11570 | 代理人: | 刘杰 |
地址: | 710065 陕西省西安市*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 情感 分析 数据处理 方法 装置 | ||
1.一种基于情感分析的数据处理方法,其特征在于,所述方法包括:
获得原始文本数据库,所述原始文本数据库中包含文本数据;
获得情感分析词典;
根据所述情感分析词典,获得第一情感权值;
获得在线序列-极限学习机模型;
根据所述在线序列-极限学习机模型,动态调整预测模型,获得第二情感权值;
根据所述第一情感权值、所述第二情感权值,确定所述第三情感权值。
2.如权利要求1所述的方法,其特征在于,所述根据所述情感分析词典,获得第一情感权值,具体包括:
根据所述情感分析词典,获得情感分数;
根据所述情感分数,判断情感极性;
根据所述文本数据,获得第一词语集合;
去除所述第一词语集合中的停留词,获得第二词语集合;
根据所述情感分数、所述情感极性、所述第二词语集合,获得所述第一情感权值。
3.如权利要求2所述的方法,其特征在于,所述根据所述情感分数,判断情感极性,具体包括:
如果所述情感分数大于零,判断所述情感极性为正;
如果所述情感分数小于零,判断所述情感极性为负。
4.如权利要求2所述的方法,其特征在于,所述第二词语集合包括否定词和/或程度副词和/或情感词。
5.如权利要求1所述的方法,其特征在于,所述根据所述在线序列-极限学习机模型,动态调整预测模型,获得第二情感权值,具体包括:
根据所述文本数据,获得第三词语集合;
去除所述第三词语集合中的停留词,获得第四词语集合;
根据所述第四词语集合,获得词向量;
获得所述词向量的主成分;
获得在线序列-极限学习机模型;
根据所述主成分、所述在线序列-极限学习机模型,动态调整预测模型,获得第二情感权值。
6.如权利要求1所述的方法,其特征在于,所述根据所述第一情感权值、所述第二情感权值,确定所述第三情感权值,具体包括:
根据所述情感分析词典,获得情感参数;
根据所述情感参数、所述第一情感权值、所述第二情感权值,确定所述第三情感权值。
7.如权利要求6所述的方法,其特征在于,所述情感参数的范围为0~1。
8.一种基于情感分析的数据处理装置,其特征在于,所述装置包括:
第一获得单元,所述第一获得单元用于获得原始文本数据库,所述原始文本数据库中包含文本数据;
第二获得单元,所述第二获得单元用于获得情感分析词典;
第三获得单元,所述第三获得单元用于根据所述情感分析词典,获得第一情感权值;
第四获得单元,所述第四获得单元用于获得在线序列-极限学习机模型;
第五获得单元,所述第五获得单元用于根据所述在线序列-极限学习机模型,动态调整预测模型,获得第二情感权值;
第一确定单元,所述第一确定单元用于根据所述第一情感权值、所述第二情感权值,确定所述第三情感权值。
9.一种基于情感分析的数据处理装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现以下步骤:
获得原始文本数据库,所述原始文本数据库中包含文本数据;
获得情感分析词典;
根据所述情感分析词典,获得第一情感权值;
获得在线序列-极限学习机模型;
根据所述在线序列-极限学习机模型,动态调整预测模型,获得第二情感权值;
根据所述第一情感权值、所述第二情感权值,确定所述第三情感权值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西识代运筹信息科技股份有限公司,未经陕西识代运筹信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711277819.2/1.html,转载请声明来源钻瓜专利网。