[发明专利]基于深度学习的文本情绪分析系统有效

专利信息
申请号: 201710093688.6 申请日: 2017-02-21
公开(公告)号: CN106919673B 公开(公告)日: 2019-08-20
发明(设计)人: 施寒潇;厉小军;陈南南 申请(专利权)人: 浙江工商大学
主分类号: G06F16/35 分类号: G06F16/35;G06F16/9535;G06F17/27;G06N3/08
代理公司: 杭州天勤知识产权代理有限公司 33224 代理人: 胡红娟
地址: 310018 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 深度 学习 文本 情绪 分析 系统
【说明书】:

发明公开了一种基于深度学习的文本情绪分析系统,包括:信息采集模块、信息预处理模块、情绪分析模块以及信息展示模块,所述的信息采集模块用于采集各互联网资源网站中的评论信息,所述的信息预处理模块用于对采集到的评论信息进行分类、分词、词性标注以及情绪信息标注处理并存储,所述的情绪分析模块用于将处理后的评论信息经过词表示模型、句子模型以及篇章模型转化为短语向量,并将该短语向量输入到情绪分类模型进行情绪分析,所述的信息展示模块用于将情绪分析结果可视化地呈现。该系统能够对评论信息进行情绪倾向性分析,可视化地呈现给用户,进而为企业或政府等相关部门提供舆情分析结果或预警。

技术领域

本发明属于计算机应用技术领域,具体涉及的是一种基于深度学习的文本情绪分析系统。

背景技术

随着互联网的飞速发展,特别是Web2.0技术的逐渐普及,广大网络用户已经从过去单纯的信息获取者变为网络内容的主要制造者。中国互联网络信息中心发布的《第38次中国互联网络发展状况统计报告》(CNNIC,2016)的数据显示,截至2016年6月,我国网络用户总数量已经达到7.10亿,半年共计新增网民2132万人,半年增长率为3.1%,互联网普及率为51.7%。如此庞大且快速增长的网络用户群体加上Web2.0模式的互联网应用,使网络内容的数量和网络信息的访问量都以前所未有的速度增长,互联网已经成为人们表达观点、获取信息的重要途径。当前互联网上的信息形式多种多样,如新闻、博客文章、产品评论、论坛帖子等等。

近几年,社会网络(social network)应用的推进和用户创造内容(UGC)模式的兴起,普通网民越来越成为信息内容的重要生产者。以金融信息评论为例,互联网上作为金融信息中UGC重要形式之一的用户评论,既表达了用户对证券市场的个体观点,又涵盖了用户与股票、用户与用户之间的关系,兼具内容与关联的特征,成为情绪分析研究的一个新热点。目前,带有情绪信息的金融评论在互联网上呈爆炸式增长,这些情绪信息对普通投资者、公司机构和国家政府等各级别的用户都有重要意义,如何有效的将带有情绪信息的金融评论转化成有助于各类用户应用的有价值资源,已成为当前需要迫切解决的问题之一。对于文本的情绪分析研究正是适应这种需求,希望架设一座用户到情绪信息的桥梁,使用户能有效获取情绪信息。从实践角度而言,利用这些情绪信息一方面可以帮助金融、证券监管部门及时了解投资者的情绪变化,特别是股灾或者疯牛这样极端行情下的情绪反馈,为后续的政策引导提供线索依据;另一方面可以给出不同类别投资者的情绪指数变化曲线,同时也可与其他主要证券行情分析指数联合构建出合理的投资模型,这在一定程度上为投资者提供更全面的投资决策支持。

目前情绪分析方法大致有两类。第一种是基于规则的方法。主要先根据情绪词典找出文本中出现的情绪词,然后进行简单的情绪极性统计,根据最终得分与事先设定阈值比较得出情绪极性结论,一般用于篇章级别的情绪分析。第二种是基于机器学习的方法。通过对大量标注语料的训练,生成情绪分类器,用来对测试文本进行分类。

(1)基于规则的方法。目前的方法主要是设计规则提取情绪词和极性判定,然后对所有的情绪词进行简单情绪极性统计求得文本的整体情绪极性,该方法更多的应用于篇章的情绪分析。另外,通过计算词语的语义倾向,综合考虑极性元素分布、密度和语义强度进行情绪词的扩展,进一步修正文本的整体情绪极性。

(2)基于机器学习的方法。这种方法主要使用情绪词、词语共现对、句法模板、主题相关特征等作为分类特征,使用基于机器学习的分类方法进行情绪/倾向性分析。常用的分类方法有:中心向量分类法、KNN分类法、感知器分类法、贝叶斯分类法、最大熵分类法和支持向量机分类法等。一般过程是首先通过对训练文档进行手工标注,生产训练模型,然后进行测试文档的预测。该方法目前在句子级别的情绪分析中有广泛的应用。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工商大学,未经浙江工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710093688.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top