[发明专利]基于Transformer实现细粒度情感分析的方法、装置、处理器及其存储介质在审
申请号: | 202210018206.1 | 申请日: | 2022-01-07 |
公开(公告)号: | CN114357173A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 俞枫;黄韦;梅龙 | 申请(专利权)人: | 国泰君安证券股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/151;G06F40/205;G06F40/216;G06F40/30;G06N3/04 |
代理公司: | 上海智信专利代理有限公司 31002 | 代理人: | 王洁;郑暄 |
地址: | 200041 上海市静安*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 transformer 实现 细粒度 情感 分析 方法 装置 处理器 及其 存储 介质 | ||
本发明涉及一种基于Transformer实现细粒度情感分析的方法,其中,该方法包括以下步骤:(1)获取Sem‑Eval 2014 Task 4的Laptop和Restaurant两个领域的数据集进行模型验证;(2)对获取到的相应数据集进行数据解析以及转换处理;(3)基于正文文本、主体以及主体情感类别进行情感分析模型的构建;(4)加入预设的初始参数进行情感分析模型的模型训练;(5)获取模型训练得到的细粒度情感分析输出结果。本发明还涉及一种相应的装置、处理器及其存储介质。采用了本发明的该基于Transformer实现细粒度情感分析的方法、装置、处理器及其存储介质,通过针对性地判别不同方面的情感类别,从而准确的识别判断出文本中某一方面级的情感倾向,相较于其他模型而言,具有更为突出的识别预测优势。
技术领域
本发明涉及人工智能技术领域,尤其涉及自然语言处理技术领域,具体是指一种基于Transformer实现细粒度情感分析的方法、装置、处理器及其计算机可读存储介质。
背景技术
在人工智能出现之前,机器智能处理结构化的数据(例如Excel里的数据)。但是现实场景中大部分的数据都是非结构化的,例如:文章、图片、音频、视频…。在非结构数据中,文本的数量是最多的,他虽然没有图片和视频占用的空间大,但是他的信息量是最大的。为了能够分析和利用这些文本信息,我们就需要利用NLP技术,让机器理解这些文本信息,并加以利用。
自然语言处理(Natural Language Processing,NLP)是计算机科学,信息工程和人工智能的子领域,涉及计算机与人类(自然)语言之间的交互,特别是如何对计算机进行编程以处理和分析大量自然语言数据。自然语言处理中的挑战通常涉及自然语言理解(NLU)和自然语言生成(NLG)两大任务。
自然语言理解就是希望机器像人一样,具备正常人的语言理解能力。自然语言理解(NLU)或自然语言解释(NLI)是自然语言处理在人工智能与机器涉及阅读理解的子主题。其应用于实体抽取、关系抽取、机器翻译、智能问答、文本分类、情感分析等诸多子领域。
自然语言生成是NLP的重要组成部分,主要目的是降低人类和机器之间的沟通鸿沟,将非语言格式的数据转换成人类可以理解的语言格式。NLG是为了跨越人类和机器之间的沟通鸿沟,将非语言格式的数据转换成人类可以理解的语言格式,如文章、报告等。
早期的粗粒度情感分析方法只能获得文本的观点信息,而事实上评价可能中包含着多个对象与方面的评价,而对这些表达对象被赋予的情感倾向可能不尽相同。例如如下评论文本:手机屏幕很清晰,但是电池续航能力太弱了。
很显然,该从文本的角度上看,我们不能直接对判断用户对这个手机的情感是正向还是负向,因为用户对手机的两个方面(Aspect)分别发表的看法,那么我们便能大致知道ABSA的两个任务了,即情感对象识别(Aspect Term Extraction),与情感对象倾向分析(Aspect Term Polarity Analysis)。前者是一个NLP的标注任务(如命名实体识别等),后者则是一个分类任务(针对性地判断Aspect的情感类别),但现有技术是缺乏针对性判断Aspect的情感类别的。
发明内容
本发明的目的是克服了上述现有技术的缺点,提供了一种基于Transformer实现细粒度情感分析的方法、装置、处理器及其计算机可读存储介质。
为了实现上述目的,本发明的基于Transformer实现细粒度情感分析的方法、装置、处理器及其计算机可读存储介质如下:
该基于Transformer实现细粒度情感分析的方法,其主要特点是,所述的方法包括以下步骤:
(1)获取Sem-Eval 2014Task 4的Laptop和Restaurant两个领域的数据集进行模型验证;
(2)对获取到的相应数据集进行数据解析以及转换处理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国泰君安证券股份有限公司,未经国泰君安证券股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210018206.1/2.html,转载请声明来源钻瓜专利网。
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法