[发明专利]业务模型的训练和确定文本分类类别的方法及装置有效
申请号: | 202010691951.3 | 申请日: | 2020-07-17 |
公开(公告)号: | CN111737474B | 公开(公告)日: | 2021-01-12 |
发明(设计)人: | 金铭民 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30;G06N3/04 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 业务 模型 训练 确定 文本 分类 类别 方法 装置 | ||
1.一种业务模型的训练方法,所述业务模型包括编码网络、融合层、全连接层,用于结合图卷积网络对类别层级关系网络的处理,确定文本分类类别,所述方法包括:
从训练样本集中获取第一文本,所述第一文本对应有文本标签,所述文本标签从多个候选类别中确定;
利用所述编码网络处理所述第一文本,得到第一语义向量;
经由图卷积网络处理类别层级关系网络,得到各个候选类别分别对应的各个类别表达向量,所述类别层级关系网络包括与各个候选类别一一对应的各个节点,具有直接上下级关系的候选类别之间由连接边连接,各个节点分别对应有相应类别特征向量作为初始的节点表达向量,所述图卷积网络用于对各个节点分别进行邻居节点的节点表达向量聚合,以更新相应的节点表达向量,各个类别表达向量分别为经所述图卷积网络最后一层更新后的相应节点表达向量;
经由所述融合层,基于各个类别表达向量与所述第一语义向量的关联程度,将各个类别表达向量融合在一起,得到针对所述第一文本的第一融合向量;
通过所述全连接层,基于所述第一融合向量与所述第一语义向量,得到针对所述第一文本所属分类类别的第一预测结果;
以所述第一预测结果与所述文本标签相一致为目标,调整所述编码网络、所述图卷积网络、融合层、全连接层中的模型参数,从而训练所述业务模型。
2.根据权利要求1所述的方法,其中,所述第一文本对应有多个层级的候选类别,所述文本标签是其中最低层级的候选类别。
3.根据权利要求1所述的方法,其中,所述第一语义向量与所述类别表达向量的维数均为s,所述经由所述融合层,基于各个类别表达向量与所述第一语义向量的关联程度,将各个类别表达向量融合在一起,得到针对所述第一文本的第一融合向量包括:
根据所述第一语义向量与各个类别表达向量的对比,确定各个类别表达向量分别与所述第一语义向量的各个第一相似度;
利用各个第一相似度对各个类别表达向量加权求和,得到所述第一融合向量,其中,各个类别表达向量的权重与相应的第一相似度正相关。
4.根据权利要求1所述的方法,所述候选类别的数量为n,所述第一语义向量与所述类别表达向量的维数均为s,所述经由所述融合层,基于各个类别表达向量与所述第一语义向量的关联程度,将各个类别表达向量融合在一起,得到针对所述第一文本的第一融合向量包括:
获取与所述第一语义向量对应的s维行向量,以及由n个类别表达向量依次排列组成的s行n列的类别向量矩阵;
基于所述s维行向量与所述s行n列的类别向量矩阵的乘积,确定n维的中间向量;
将所述n维的中间向量中的各个元素,分别作为相应候选类别的加权权重,对各个类别表达向量加权平均,得到所述第一融合向量。
5.根据权利要求1所述的方法,其中,所述通过所述全连接层,基于所述第一融合向量与所述第一语义向量,得到针对所述第一文本所属分类类别的第一预测结果包括:
将所述第一融合向量与所述第一语义向量拼接,得到第一拼接向量;
通过所述全连接层处理所述第一拼接向量,得到所述第一预测结果。
6.根据权利要求1所述的方法,其中,所述以所述第一预测结果与所述文本标签相一致为目标,调整所述编码网络、所述图卷积网络、融合层、全连接层中的模型参数,从而训练所述业务模型包括:
利用交叉熵的方式确定所述第一预测结果相对于所述文本标签的损失;
向所述损失减小的方向调整所述编码网络、所述图卷积网络、融合层、全连接层中的模型参数。
7.根据权利要求1所述的方法,在初始的各个类别特征向量为随机值的情况下,所述方法还包括:
以所述第一预测结果与所述文本标签相一致为目标,调整所述类别层级关系网络中的各个类别特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010691951.3/1.html,转载请声明来源钻瓜专利网。