[发明专利]基于半监督学习的意图识别方法、装置、设备及介质在审
申请号: | 202111009255.0 | 申请日: | 2021-08-31 |
公开(公告)号: | CN113704429A | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 南海顺 | 申请(专利权)人: | 平安普惠企业管理有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/35;G06F40/295;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 监督 学习 意图 识别 方法 装置 设备 介质 | ||
1.一种基于半监督学习的意图识别方法,其特征在于,所述方法包括:
从会话意图语料库中抽取用户的意图文本,对所述意图文本进行实体标注及实体增强处理,得到意图实体集合;
对所述意图实体集合中的意图实体进行标签聚类,得到意图类别;
利用所述意图类别的意图标签得到标注训练集,利用所述标注训练集训练预构建的神经网络,得到原始意图识别模型;
从所述会话意图语料库中抽取未标注训练集,并利用所述未标注训练集及所述标注训练集对所述原始意图识别模型进行迭代训练,得到半监督训练模型;
利用交叉验证法对所述半监督训练模型进行交叉训练,得到标准意图识别模型,并利用所述标准意图识别模型输出待识别文本的意图识别结果。
2.如权利要求1所述的基于半监督学习的意图识别方法,其特征在于,所述对所述意图文本进行实体标注及实体增强处理,得到意图实体集合,包括:
利用预设的序列标注方法对所述意图文本进行实体标注处理;
利用预设的实体识别模型中的实体识别层对实体标注结果所包含的多个实体进行实体预测,得到所述多个实体的类型预测分数;
根据所述类型预测分数和预设的实体限制规则对所述多个实体进行实体筛选,并对筛选过后的实体进行实体加强处理,汇总所有实体加强后的实体得到所述意图实体集合。
3.如权利要求2中所述的基于半监督学习的意图识别方法,其特征在于,所述对所述意图实体集合中的意图实体进行标签聚类,得到意图类别,包括:
利用预设的自然语言模型对所述意图实体集合中的实体进行向量映射,得到意图向量集合;
从所述意图向量集合中随机选取预设个数的样本作为聚类中心;
依次计算所述意图向量集合中每个样本到所述聚类中心的距离,并将所述每个样本分到距离最小的聚类中心对应的类别中,得到多个类别簇;
重新计算每个类别簇的聚类中心,并返回依次计算所述意图向量集合中每个样本到所述聚类中心的距离,直至所述多个类别簇的聚类中心收敛,确定收敛的类别簇作为所述意图类别。
4.如权利要求3所述的基于半监督学习的意图识别方法,其特征在于,所述计算每个类别簇的聚类中心,包括:
通过下述聚类公式计算每个类别簇的聚类中心:
其中,Ei为第i个聚类中心,Ci为第i个类别簇,x为类别簇中的样本。
5.如权利要求1所述的基于半监督学习的意图识别方法,其特征在于,所述利用所述标注训练集训练预构建的神经网络,得到原始意图识别模型,包括:
利用所述神经网络对所述标注训练集中的文本进行意图预测,得到预测结果;
根据所述预测结果和所述标准训练集中的意图标签计算预测准确率,当所述预测准确率大于等于预设的第一准确阈值时,得到所述原始意图识别模型。
6.如权利要求1所述的基于半监督学习的意图识别方法,其特征在于,所述利用所述未标注训练集及所述标注训练集对所述原始意图识别模型进行迭代训练,得到半监督训练模型,包括:
利用所述原始意图识别模型输出所述未标注训练集中各语料的预测标签及预测标签对应的预测概率;
选取所述预测概率大于等于预设的第一预测阈值的预测标签及预测标签对应的语料作为补充标注训练数据添加至所述标注训练集;
利用所述原始意图识别模型重新预测补充后的标注训练集中各语料的意图标签,并计算准确率,在所述准确率未收敛时,返回所述从所述会话意图语料库中抽取未标注训练集的步骤,直至所述准确率收敛时,停止迭代,得到所述半监督训练模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安普惠企业管理有限公司,未经平安普惠企业管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111009255.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:光栅结构加载的垂直PIN型光电探测器及其制备方法
- 下一篇:钢球筛选上料系统