[发明专利]一种修辞识别的方法、装置及电子设备有效

申请号：	202110076417.6	申请日：	2021-01-20
公开（公告）号：	CN112765954B	公开（公告）日：	2023-06-23
发明（设计）人：	王晓辉;杨熙;饶丰;赵晖	申请（专利权）人：	北京一起教育科技有限责任公司
主分类号：	G06F40/211	分类号：	G06F40/211;G06F40/30;G06F18/24;G06N3/08
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	柳欣
地址：	100102 北京市朝阳***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种修辞识别方法装置电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种修辞识别的方法，其特征在于，包括：

预设修辞识别模型，所述修辞识别模型包括映射层、n个自注意力层、n-1个子分类器和总分类器，所述映射层连接第1个所述自注意力层的输入层，且第i个所述自注意力层的输出端与下一个所述自注意力层的输入端相连；第i个所述子分类器与第i个所述自注意力层的输出端相连，且第n个所述自注意力层的输出端与所述总分类器相连，n≥2；

确定待识别的目标句子，将所述目标句子输入至所述修辞识别模型，并根据所述修辞识别模型映射层确定所述目标句子的目标特征向量；

循环执行分类过程，直至确定所述目标句子对应的修辞标签；

其中，所述分类过程包括：

当前的自注意力层对上一层输出的目标特征向量进行自注意力处理，生成处理后的目标特征向量；

当前的子分类器根据所述处理后的目标特征向量进行分类处理，若分类置信度超过预设阈值，根据当前的分类结果确定所述目标句子对应的修辞标签，否则所述当前的自注意力层将所述处理后的目标特征向量传递给下一个自注意力层。

2.根据权利要求1所述的方法，其特征在于，在所述预设修辞识别模型之前，包括：

根据修辞训练样本对所述修辞识别模型的预训练部分进行训练，确定所述预训练部分的权重参数，所述预训练部分包括所述映射层、n个自注意力层和总分类器；

在保持所述预训练部分的权重参数不变的情况下，将无标句子输入至所述修辞识别模型，根据所述总分类器的输出结果确定所述无标句子对应的分类概率分布，并确定每个所述子分类器输出的预测概率分布；

将所述子分类器输出预测概率分布与所述无标句子的分类概率分布之间的相对熵、或者多个所述子分类器输出预测概率分布与所述无标句子的分类概率分布之间的相对熵之和作为损失函数，基于所述无标句子对所述子分类器进行训练，并最终确定训练后的修辞识别模型。

3.根据权利要求2所述的方法，其特征在于，所述根据修辞训练样本对所述修辞识别模型的预训练部分进行训练包括：

将所述修辞训练样本中训练样本句子对应的修辞标签的概率设为1-ε，将所述训练样本句子的其他修辞标签的概率设为其中，ε为小于0.1的正数，K为修辞标签的分类数量。

4.根据权利要求2所述的方法，其特征在于，在所述根据修辞训练样本对所述修辞识别模型的预训练部分进行训练之后，还包括：