[发明专利]一种基于语法依赖图与词典扩展的中文情感极性检测方法在审
| 申请号: | 202111202617.8 | 申请日: | 2021-10-15 |
| 公开(公告)号: | CN114021553A | 公开(公告)日: | 2022-02-08 |
| 发明(设计)人: | 荣欢;季俊如 | 申请(专利权)人: | 南京信息工程大学 |
| 主分类号: | G06F40/253 | 分类号: | G06F40/253;G06F40/289;G06F40/30;G06F40/242;G06F40/216 |
| 代理公司: | 南京钟山专利代理有限公司 32252 | 代理人: | 王路 |
| 地址: | 210044 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 语法 依赖 词典 扩展 中文 情感 极性 检测 方法 | ||
1.一种基于语法依赖图与词典扩展的中文情感极性检测方法,其特征在于,包括以下步骤:
步骤1,输入待处理的语料库,对语料库中的文本进行预处理,对照所有种子词典将语料库中所有文本分词处理,进行词性标注以及去停用词工作,并添加否定标记,将具有否定意义的词汇否定标志置1;
步骤2,对于步骤1得到的预处理之后的数据集中的文本视为词语序列,以词语为节点,依据词语间语法关系进行依赖关系分析,并根据依赖关系生成相应依赖图,依据所采用的种子词典对词语节点的情感极性强度值初始化处理;
步骤3,对所采用的多个种子词典中的每一个种子词典中的正向词汇列表即P_WL、负向词汇列表即N_WL进行交叉计算,去除其交集部分得到极性种子词汇表,包括正向种子词汇表即P_SWL、负向种子词汇表即N_SWL;
步骤4,根据步骤3中得出的极性种子词汇表,对步骤2所得出的依赖图中所有节点词汇进行分类并归纳进P_SWL、N_SWL,若节点词汇都不在P_SWL、N_SWL中,则单独归纳进未知词汇表Unknown_list;
步骤5,对于步骤4中每一个节点词汇,基于步骤2所获得的依赖图中相邻节点的情感极性强度值进行情感极性强度值计算,可以得出部分未知词汇表中词汇的情感极性强度值,重复迭代直至未知词汇表中词汇清零;
步骤6,对步骤5中所有得出情感极性的词汇依据其情感极性强度值进行降序排列并重新分组,将否定标记为1的词汇的情感极性逆置后把所有词汇的否定标记置0;
步骤7,将步骤6中处理完毕的词汇记为词典扩展结果保存并反馈至步骤3)的种子词典中,从中抽取目标语料域即待处理语料库内词语的情感极性信息,将其作为初始情感特征对称映射,构建一个完整的情感特征空间;
步骤8,采用词频对步骤7中所获得的情感特征空间进行特征枝剪,提取情感特征子集;
步骤9,根据步骤8)中所提取的情感特征子集中的特征,通过关键情感特征将文本表示为n维0-1向量,再将n维向量依据“正向情感特征”与“负向情感特征”划分为两个子向量,最终对每个给定文本输出n+2维向量,其中n为情感特征子集中包含的特征总数,2为当前特征向量中“正向”与“负向”词语总数。
2.根据权利要求1所述的基于语法依赖图与词典扩展的中文情感极性检测方法,其特征在于:步骤2中,根据词语间的语法关系,即词语共现关系,对所得语法依赖图的依赖关系进行限制缩减,以获得最终的语法依赖图,其中词语共现关系具体包括由连词连接的两个词语或在文本中常共同出现的词对以及形如“形容词/副词+动词/习语”的任意修饰组合。
3.根据权利要求1所述的基于语法依赖图与词典扩展的中文情感极性检测方法,其特征在于:步骤3中,所述对所采用的多个种子词典中的每一个种子词典中的P_WL及N_WL进行交叉计算并去除冲突部分,具体如下:
步骤31,设种子词典中每个情感极性词典包括正向词汇列表P_WL与负向词汇列表N_WL,计算任意两个种子词典i和j的正向词列表对(P_WLi,P_WLj)的交集,将所有正向词列表对的交集合并并记为P_WL*;同理,计算任意两个种子词典i和j的负向词列表对(N_WLi,N_WLj)的交集,并将计算得出的所有交集合并并记为N_WL*;
步骤32,根据公式(1)和公式(2)分别遍历计算不同P_WL*与N_WL*各自的交集,并进行删减,最终形成正向关键词列表P_KWL与负向关键词列表N_KWL,
步骤33,根据公式(3)和(4)计算正负关键词表对(P_KWL,N_KWL)的交集,并将其分别从P_KWL与N_KWL中扣除,最终获的正向种子词汇列表P_SWL与负向种子词汇列表N_SWL,具体如下:
P_SWL=P_KWL-(P_KWL∩N_KWL) (3)
N_SWL=N_KWL-(P_KWL∩N_KWL) (4)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111202617.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种提高船舶结构寿命的焊后处理方法
- 下一篇:轨道自行走翻罐撞罐倒渣方法





