[发明专利]一种面向可解释的情感溯源方法在审
| 申请号: | 202110743688.2 | 申请日: | 2021-06-30 |
| 公开(公告)号: | CN113590744A | 公开(公告)日: | 2021-11-02 |
| 发明(设计)人: | 万海;黄紫菱;刘亚男;曾娟;黄佳莉 | 申请(专利权)人: | 中山大学 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/951;G06F40/117;G06F40/186 |
| 代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 刘俊 |
| 地址: | 510275 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 可解释 情感 溯源 方法 | ||
本发明提供一种面向可解释的情感溯源方法,该方法针对情感分析问题,首次提出了情感溯源的概念,情感溯源指的是对情感分析过程找到完整的推理链路以及推理链路具有文本支撑;利用规则模板,使得情感分析的过程更具有可解释性;利用对溯因证据模型,对提取到的规则寻找文本支撑,本发明认为,只有具备文本支撑的规则,才能作为正确的规则,加入到结果中,使得结果更为准确;验证了溯因证据模型可以有助于情感溯源,从而有助于情感分析,具有较好的实用性。
技术领域
本发明涉及计算机技术的自然语言领域,更具体地,涉及一种面向可解释的情感溯源方法。
背景技术
溯因推理在形式逻辑和自然语言处理中都有研究。溯因推理指的是,给定一个理论C和可能暗示Q,这个暗示是不能在理论C中证明的。存在一个新的事实f,在C中添加了f,可以得出暗示Q,在NLP中,可以通过遮盖的方式,将f从C中遮盖掉。
情感分析在近年来,因为社交媒体的快速发展而得到了诸多研究者的关注,随着社交媒体的快速发展,评论、论坛讨论、社交平台的言论等信息大量出现,对于这些信息挖掘表达者对事物、事件或主题等实体的情感,有助于了解该类人群的观点以及他们做出的选择。自2000年初开始,情感分析就成为自然语言处理种最活跃的研究领域之一。
情感分析是对信息进行情感分类,有的任务分成两类:正面或负面,有的任务在此基础上增加了中性的分类。早期的情感分析方法包括有监督的方法和无监督的方法,有监督的方法是基于传统的机器学习方法,例如支持向量机、最大熵、朴素贝叶斯等,无监督的方法例如情感词典等。后来,随着机器学习的发展,机器学习的方法也用于情感分析的任务中,例如Kalchbrenner等人提出了一种动态CNN模型(DCNN),该模型使用动态K-Max池化算法作为非线性子采样函数,特征图由网络生成,能够捕捉词之间的关系。随着情感分析的发展,Thet等人提出了方面情感分析的任务,方面情感需要同时考虑情感和目标信息,目标通常为实体或者方面,即给定一个句子和一个目标方面,方面级情感分类旨在推断句子对于指定目标方面的情感极性。
现有方法的基本是无监督的情感词典方法或者是有监督的深度学习网络的方法,但是现有的模型存在解释性不强的问题,而且也存在迁移性不强的问题,对于另一个领域的文本,使用有监督的方法可能需要再次进行大量标注和训练。
发明内容
本发明提供一种面向可解释的情感溯源方法,该方法弥补过去的情感分析模型可解释性不高的问题,通过情感溯源得到更有说服力的结果。
为了达到上述技术效果,本发明的技术方案如下:
一种面向可解释的情感溯源方法,包括以下步骤:
S1:采集数据并对采集的数据进行预处理;
S2:训练规则抽取模型;
S3:训练溯因证据模型;
S4:组成情感溯因结果;
S5:输入未标注文本得到情感溯因结果。
进一步地,所述步骤S1的具体过程是:
S11:从社交平台或者购物平台上爬取评论信息;
S12:针对爬取到的信息,清洗去除其中不涉及评价的部分,保留表达了用户对商品或者实体情绪或者看法的信息;
S13:人工对爬取得到的信息进行标注,其中,标注的内容包括:句子涉及的方面类别以及对应的情感极性、得到这个结果的推理过程、将这个推理过程模板化得到规则模板,并标注规则模板中,哪些子句属于需要在文本中寻找证据的,哪些属于外部知识。
进一步地,所述步骤S2的具体过程是:
S21:划分数据集为训练集和测试集,其中训练集70%,测试集30%;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110743688.2/2.html,转载请声明来源钻瓜专利网。





