[发明专利]一种修辞识别的方法、装置及电子设备有效
| 申请号: | 202110076417.6 | 申请日: | 2021-01-20 |
| 公开(公告)号: | CN112765954B | 公开(公告)日: | 2023-06-23 |
| 发明(设计)人: | 王晓辉;杨熙;饶丰;赵晖 | 申请(专利权)人: | 北京一起教育科技有限责任公司 |
| 主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/30;G06F18/24;G06N3/08 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 柳欣 |
| 地址: | 100102 北京市朝阳*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 修辞 识别 方法 装置 电子设备 | ||
1.一种修辞识别的方法,其特征在于,包括:
预设修辞识别模型,所述修辞识别模型包括映射层、n个自注意力层、n-1个子分类器和总分类器,所述映射层连接第1个所述自注意力层的输入层,且第i个所述自注意力层的输出端与下一个所述自注意力层的输入端相连;第i个所述子分类器与第i个所述自注意力层的输出端相连,且第n个所述自注意力层的输出端与所述总分类器相连,n≥2;
确定待识别的目标句子,将所述目标句子输入至所述修辞识别模型,并根据所述修辞识别模型映射层确定所述目标句子的目标特征向量;
循环执行分类过程,直至确定所述目标句子对应的修辞标签;
其中,所述分类过程包括:
当前的自注意力层对上一层输出的目标特征向量进行自注意力处理,生成处理后的目标特征向量;
当前的子分类器根据所述处理后的目标特征向量进行分类处理,若分类置信度超过预设阈值,根据当前的分类结果确定所述目标句子对应的修辞标签,否则所述当前的自注意力层将所述处理后的目标特征向量传递给下一个自注意力层。
2.根据权利要求1所述的方法,其特征在于,在所述预设修辞识别模型之前,包括:
根据修辞训练样本对所述修辞识别模型的预训练部分进行训练,确定所述预训练部分的权重参数,所述预训练部分包括所述映射层、n个自注意力层和总分类器;
在保持所述预训练部分的权重参数不变的情况下,将无标句子输入至所述修辞识别模型,根据所述总分类器的输出结果确定所述无标句子对应的分类概率分布,并确定每个所述子分类器输出的预测概率分布;
将所述子分类器输出预测概率分布与所述无标句子的分类概率分布之间的相对熵、或者多个所述子分类器输出预测概率分布与所述无标句子的分类概率分布之间的相对熵之和作为损失函数,基于所述无标句子对所述子分类器进行训练,并最终确定训练后的修辞识别模型。
3.根据权利要求2所述的方法,其特征在于,所述根据修辞训练样本对所述修辞识别模型的预训练部分进行训练包括:
将所述修辞训练样本中训练样本句子对应的修辞标签的概率设为1-ε,将所述训练样本句子的其他修辞标签的概率设为其中,ε为小于0.1的正数,K为修辞标签的分类数量。
4.根据权利要求2所述的方法,其特征在于,在所述根据修辞训练样本对所述修辞识别模型的预训练部分进行训练之后,还包括:
对所述预训练部分的最后一个或两个的自注意力层进行微调。
5.根据权利要求1-4任意一项所述的方法,其特征在于,所述确定待识别的目标句子包括:
对待识别作文进行分段处理,确定每段对应的文本;
将句子终止符作为分隔符,确定每段文本中的句子;
对所述句子进行筛选处理,将剩余的句子作为待识别的目标句子;
其中,所述筛选处理包括去除长度小于预设值的句子、去除半数以上为拟声词的句子、去除约定俗成句子中的一种或多种。
6.根据权利要求5所述的方法,其特征在于,在所述确定所述目标句子对应的修辞标签之后,还包括:
对所有所述目标句子的修辞标签进行统计处理,确定所述待识别作文的修辞参数,所述修辞参数包括每种修辞标签的数量和/或每种修辞标签与所述待识别作文的总句子数量的比值;
根据所述修辞参数对所述待识别作文进行打分处理,确定所述待识别作文的分值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京一起教育科技有限责任公司,未经北京一起教育科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110076417.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种改进的多功能轮椅
- 下一篇:一种便携式呼吸科给药器





