[发明专利]一种知识感知的情感分析方法在审
| 申请号: | 202110572656.0 | 申请日: | 2021-05-25 |
| 公开(公告)号: | CN113191160A | 公开(公告)日: | 2021-07-30 |
| 发明(设计)人: | 柯尊旺;李哲;刘士坤;代立;韩华伟 | 申请(专利权)人: | 新疆大学 |
| 主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/253;G06F40/242;G06F40/211;G06N3/04;G06N3/08 |
| 代理公司: | 西安铭泽知识产权代理事务所(普通合伙) 61223 | 代理人: | 张举 |
| 地址: | 830008 新疆维吾尔自治区*** | 国省代码: | 新疆;65 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 知识 感知 情感 分析 方法 | ||
本发明提供了一种知识感知的情感分析方法,属于人工智能领域,包括:收集自然语言解释ei,并利用语义解析器将收集的自然语言解释ei生成一系列候选标签函数;将候选标签函数输入到过滤器组中进行过滤,剔除超过设定阈值的候选标签函数;将剩余的候选标签函数应用于未标注的样本实例,并生成标注矩阵,将标注矩阵传递给标注聚合器,所述标注聚合器将标注矩阵中存在潜在冲突和重叠的标注集成到每个样本中生成新的标注;利用生成的新的标注对情感分类器判别模型进行训练,根据所述情感分类器判别模型进行情感分析。该方法在解决公开情感分析数据集的标注数据稀缺性和类别不平衡问题方面具有潜在的效率和有效性。
技术领域
本发明属于人工智能领域,具体涉及一种知识感知的情感分析方法。
背景技术
情感分析是舆情分析的关键,它可以为人们提供有价值的情感倾向。现有的情感分析方法依赖于从用户生成的内容中寻找情感元素。然而,为什么一个信息产生某种情感的原因在以前的作品中并没有很好地探索或利用。
情感分析是自然语言处理中的一项重要任务,也是一些流行的下游任务的核心,如舆情分析。这项任务的重点是预测一个给定输入句子的情感信息。然而,以前的工作通常需要大量的标记数据,这限制了它们在数据标注昂贵的情况下的应用。
提供监督的传统方法是通过人为生成的标签。例如,如果你说一句话,“不管怎样,食物不错,价格合适,他们的酒单不错”,标注员应该标注为“积极”。然而,标签并没有提供关于如何做出决定的信息。一种信息更丰富的方法是让注释器能够用自然语言解释他们的决定,这样注释就可以推广到其他示例。
在上面的例子中,一种解释可以是“积极的,因为词语‘食物’出现在‘非常好’之前,词语‘价格出现在词语‘合理之前,在两个词语中,这可以概括为“价格合理的美味食物”。自然语言解释显示了提供额外监督的有效性,特别是在低资源环境下。此外,可以很容易地从人类注释人员那里收集它们,而无需显著增加注释工作。
然而,由于人类语言的复杂性,利用自然语言解释作为监督是具有挑战性的。首先,文本数据的结构不是很好,因此必须将解释解析为逻辑形式,以便机器能够更好地利用它们。此外,语言变体是普遍存在的,这使得很难概括出一个自然语言解释来匹配语义等价但单词用法不同的句子。当前面的例子解释进行精确匹配时,它可能无法给句子标注“合理的价格”或“好面包”。
在用自然语言解释训练分类器方面已经做了一些尝试。之前的作品依赖于识别相关的输入部分,包括标记特征,突出文本中的基本原理短语,或者标记图像中的相关区域。然而,某些类型的信息不能简单地归因于注释输入的某一部分,例如缺少一个单词或至少两个单词。因此,自然语言解释的泛化能力尚未得到充分的探索。综上所述,一个好的数据注释方法应该满足一下两点:1)能够将注释泛化到语义相似的实例(超出词干、词性等);2)对注释中的不确定性进行建模。
因此,本身提出一种知识感知的情感分析方法。
发明内容
为了克服上述现有技术存在的不足,为了应对这一挑战,本发明提出了一个用于情感分析的自然语言解释框架,该框架为每个新的情感标签提供足够的领域知识来生成额外的标记数据。基于规则的语义解析器将这些解释转换为程序化标记函数,为任意数量的未标记情感信息生成噪声标签,以训练情感分析分类器。
本发明提出SANLE框架,通过语义解析器对数据集进行自然语言解释作为外部知识,并将知识嵌入作为输入,与词嵌入共同训练情感分析模型。SANLE框架通过自然语言解释将未标记数据转换为带有噪声标记的训练集。SANLE三个关键组件组成:语义解析器、标签过滤器和标签聚合器。语义解析器将自然语言解释转换成一系列表示标记函数的逻辑形式。标签过滤器删除一些可能超过所需阈值的不正确的标签函数。其余的标记功能应用于未标记的实例,以生成标记矩阵。这个标记矩阵被传递给标记聚合器,该聚合器将这些潜在冲突和重叠的标记集成到每个示例的一个标记中生成新的标注。生成的新的标注用于训练任何判别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新疆大学,未经新疆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110572656.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电机导流件及吸尘设备
- 下一篇:一种吸尘设备





