[发明专利]基于BERT的多特征融合实体情感分析方法及系统在审
申请号: | 202110055036.X | 申请日: | 2021-01-15 |
公开(公告)号: | CN112732920A | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 吴佳鸣 | 申请(专利权)人: | 北京明略昭辉科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F40/117;G06F40/30;G06N3/08;G06N3/04 |
代理公司: | 青岛清泰联信知识产权代理有限公司 37256 | 代理人: | 赵燕 |
地址: | 100089 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 bert 特征 融合 实体 情感 分析 方法 系统 | ||
1.一种基于BERT的多特征融合实体情感分析方法,其特征在于,包括如下步骤:
标注步骤:对文本进行标注,获取实体情感数据;
训练步骤:基于所述实体情感数据进行模型训练,获取实体情感分类模型;
预测步骤:使用所述实体情感分类模型对预测文本进行实体情感分析。
2.如权利要求1所述的基于BERT的多特征融合实体情感分析方法,其特征在于,所述标注步骤具体包括以下步骤:
构建步骤:构建标注平台;
输入步骤:将所述文本输入所述标注平台中进行人工实体与实体情感标注,获取所述实体情感数据。
3.如权利要求2所述的基于BERT的多特征融合实体情感分析方法,其特征在于,所述构建步骤具体包括以下步骤:
规则定义步骤:定义标注规则;
标签定义步骤:定义标注标签;
实例给定步骤:给定标注实例。
4.如权利要求1所述的基于BERT的多特征融合实体情感分析方法,其特征在于,所述训练步骤具体包括以下步骤:
校验步骤:对所述实体情感数据进行数据格式校验,并划分获取训练数据集;
标记步骤:对所述训练数据集进行位置信息标记;
特征获取步骤:将含有标记信息的所述训练数据集输入BERT预训练模型,获取隐藏层输出特征向量;
特征融合步骤:基于所述隐藏层输出特征向量获取融合特征向量;
参数获取步骤:通过softmax将所述融合特征向量进行概率化,获取模型参数。
5.如权利要求4所述的基于BERT的多特征融合实体情感分析方法,其特征在于,所述标记步骤中位置信息标记包括整句分类标识符标记、实体起始位置标记、实体结束位置标记。
6.如权利要求4所述的基于BERT的多特征融合实体情感分析方法,其特征在于,所述特征融合步骤具体包括以下步骤:
组合步骤:使用加和取算数平均再输入给前馈神经网络的方式对所述隐藏层输出特征向量进行组合,计算出整句分类向量、实体上文向量、实体下文向量和实体向量;
拼接步骤:将所述整句分类向量、实体上文向量、实体下文向量和实体向量拼接后进行融合,获取所述融合特征向量。
7.如权利要求4所述的基于BERT的多特征融合实体情感分析方法,其特征在于,使用反向传播梯度下降对所述模型参数进行调整。
8.一种基于BERT的多特征融合实体情感分析系统,其特征在于,包括:
标注模块,对文本进行标注,获取实体情感数据;
训练模块,基于所述实体情感数据进行模型训练,获取实体情感分类模型;
预测模块,使用所述实体情感分类模型对预测文本进行实体情感分析。
9.如权利要求8所述的基于BERT的多特征融合实体情感分析系统,其特征在于,所述标注模块具体包括:
构建单元,构建标注平台;
输入单元,将所述文本输入所述标注平台中进行人工实体与实体情感标注,获取所述实体情感数据。
10.如权利要求9所述的基于BERT的多特征融合实体情感分析系统,其特征在于,所述构建单元具体包括:
规则定义单元,定义标注规则;
标签定义单元,定义标注标签;
实例给定单元,给定标注实例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略昭辉科技有限公司,未经北京明略昭辉科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110055036.X/1.html,转载请声明来源钻瓜专利网。