[发明专利]一种对网络舆情信息进行情感分类的方法在审
| 申请号: | 201510359172.2 | 申请日: | 2015-06-25 |
| 公开(公告)号: | CN104899335A | 公开(公告)日: | 2015-09-09 |
| 发明(设计)人: | 刘念 | 申请(专利权)人: | 四川友联信息技术有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27;G06K9/62;G06N3/08 |
| 代理公司: | 四川力久律师事务所 51221 | 代理人: | 王芸;林辉轮 |
| 地址: | 610015 四川省成*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 网络 舆情 信息 进行 情感 分类 方法 | ||
1.一种对网络舆情信息进行情感分类的方法,其特征在于,包括以下步骤:
(1)对网络舆情信息的文章进行中文分词;
(2)将分词后的词汇输入神经网络;
(3)计算出所述文章的正负面性完成情感分类。
2.根据权利要求1所述的对网络舆情信息进行情感分类的方法,其特征在于,所述中文分词采用ICTCLAC中文分词系统。
3.根据权利要求2所述的对网络舆情信息进行情感分类的方法,其特征在于,所述中文分词采用ICTCLAC中文分词系统对所述文章进行分词,保留名词、动词和形容词作为特征。
4.根据权利要求3所述的对网络舆情信息进行情感分类的方法,其特征在于,所述中文分词采用ICTCLAC中文分词系统对所述文章进行分词,保留名词、动词和形容词作为特征之后、输入神经网络之前还包括特征选择步骤。
5.根据权利要求4所述的对网络舆情信息进行情感分类的方法,其特征在于,所述特征选择步骤具体为:采用文档频率、χ2统计、信息增益或互信息方法,选择所需的特征作为神经网络的输入。
6.根据权利要求1所述的对网络舆情信息进行情感分类的方法,其特征在于,所述神经网络为BP神经网络。
7.根据权利要求6所述的对网络舆情信息进行情感分类的方法,其特征在于,所述BP神经网络为3层或大于3层的前馈型BP神经网络。
8.根据权利要求6所述的对网络舆情信息进行情感分类的方法,其特征在于,所述BP神经网络为经过训练的BP神经网络,所述训练步骤如下:
a.通过网络爬虫技术爬取网络舆情信息的文章;
b.对爬取的文章通过ICTCLAC中文分词系统进行分词;
c.分词后采用χ2统计法进行文本特征选择,选择所需的中文词汇;
d.将爬取的文章进行文章正负面性的人工判别,判别文章是正面的,负面的,还是中性的;
e.将χ2统计法后选择的中文词汇出现的数量作为神经网络的输入,文章正负面性的判别结果作为神经网络的输出,对神经网络进行训练,计算出神经网络的各层权值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川友联信息技术有限公司,未经四川友联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510359172.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种文件索引的建立方法及系统
- 下一篇:一种无类别标签的时间序列异常检测方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





