[发明专利]一种基于python文本分析的上市公司负面报道信息分析系统在审
| 申请号: | 202011073264.1 | 申请日: | 2020-10-09 |
| 公开(公告)号: | CN112241627A | 公开(公告)日: | 2021-01-19 |
| 发明(设计)人: | 张倩萍;曹崇延 | 申请(专利权)人: | 中国科学技术大学 |
| 主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/30;G06F40/284;G06F40/237 |
| 代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 张乾桢 |
| 地址: | 230026 安*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 python 文本 分析 上市公司 负面 报道 信息 系统 | ||
1.一种基于python文本分析的上市公司负面报道信息分析系统,其特征在于,包括:
采集模块,用于获取媒体报道文本信息,其中包括进行对文本信息进行解码识别转换,并将采集的文本信息传输至提取模块;
提取模块,用于进行对获取的媒体报道文本信息进行关键字进行提取,获取文本特征信息,其中文本特征信息作为分析模块的输入;
分析模块,用于对获取的文本特征信息进行语义情感分析,并将语义情感分析作为所述输出模块的输入,其中包括对文本特征信息进行词水平语义情感分析和句子水平语义情感分析;
输出模块,用于获取所述分析模块的语义情感分析结果,并将分析结果输出为对应的文件或进行可视化展示。
2.根据权利要求1所述的一种基于python文本分析的上市公司负面报道信息分析系统,其特征在于:
其中,所述提取模块其关键字提取包括负面词汇提取、正面词汇提取、否定词汇提取和程度副词提取。
3.根据权利要求1所述的一种基于python文本分析的上市公司负面报道信息分析系统,其特征在于:
其中,所述关键字提取还包括:标定负面词汇语句、标定正面词汇语句、标定否定词汇语句和标定程度副词语句。
4.根据权利要求1所述的一种基于python文本分析的上市公司负面报道信息分析系统,其特征在于:
所述分析模块进行词水平语义情感分析,包括:利用嵌入矩阵We,将单词wit映射到一个信息向量yit中,表示为:
yit=Wewit,t∈[1,Lw];
一篇报道包含Ls个句子,每个句子包含Lw个单词,wit代表第i个句子中的第t个单词,并且i∈[1,Ls],t∈[1,Lw];单词wit映射到一个信息向量yit中,mGRU是一种双向的单元,包含前馈和反馈两个过程;
以来结合和获取包含以单词wit为中心的所有信息。
5.根据权利要求4所述的一种基于python文本分析的上市公司负面报道信息分析系统,其特征在于:
其中一个句子中的单词数量为w个,每个单词的权值依赖于情感信息hit,其注意力权值表示为:
其中,σ代表Sigmoid函数,Ww是对情感信息hit的权重矩阵,bw代表对应的偏置值,是对情感信息hit权值后的隐式表示,是cw与同一维度的随机向量,是预测中心单词的概率,si包含了对应句子的信息。
6.根据权利要求1所述的一种基于python文本分析的上市公司负面报道信息分析系统,其特征在于:
所述分析模块进行报道水平语义情感分析,包括每篇报道中的句子数量为s个,表示为:
yi=Wesi,i∈[1,Ls];
信息中包含Ls个句子,每个句子包含Lw个单词;We是嵌入矩阵,以来结合和获取包含以句子si为中心的所有信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011073264.1/1.html,转载请声明来源钻瓜专利网。





