[发明专利]一种表示学习模型的评估方法、装置、设备及介质在审
申请号: | 201910549544.6 | 申请日: | 2019-06-24 |
公开(公告)号: | CN110263939A | 公开(公告)日: | 2019-09-20 |
发明(设计)人: | 周晋;李超;王翔 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 学习 样本 量化指标 向量 性能评价指标 训练过程 迭代过程 机器学习 模型生成 样本表示 样本子集 无监督 衡量 评估 申请 本子 | ||
1.一种表示学习模型的评估方法,其特征在于,包括:
针对基于无监督方式进行训练的表示学习模型,生成所述表示学习模型的性能评价指标,所述性能评价指标包括第一指标和第二指标中的至少一个;
其中,所述第一指标是基于所述表示学习模型在训练过程中学习到的第一样本子集中各样本的表示向量,生成的用于衡量同类样本相近且不同类样本相疏远的量化指标;所述第一样本子集是对所述表示学习模型的训练样本集中的第一子集进行标签标注生成的,所述第一子集包括不同类别的样本;
所述第二指标是基于所述表示学习模型在训练过程中学习到的第二样本子集中各样本的表示向量对应的相似向量,生成的用于衡量样本表示稳定性的量化指标;所述第二样本子集是所述训练样本集中的第二子集;
根据所述性能评价指标,确定所述表示学习模型的训练情况。
2.根据权利要求1所述的方法,其特征在于,所述生成第一指标包括:
获取所述表示学习模型在训练过程中针对第一样本子集各样本学习得到的表示向量;
根据所述第一样本子集各样本的表示向量和标签,确定各类样本的类别间距离和类别内距离,根据所述类别间距离和所述类别内距离的比值生成分合比;
将所述分合比作为第一指标。
3.根据权利要求2所述的方法,其特征在于,所述性能评价指标包括第一指标;
则根据所述性能评价指标,确定所述表示学习模型的训练情况,包括:
当预设时间段内基于多个迭代轮次所确定的多个所述分合比呈收敛状态且收敛值大于第一参考阈值时,确定所述表示学习模型的训练情况趋于稳定。
4.根据权利要求1所述的方法,其特征在于,所述生成第二指标包括:
获取所述表示学习模型在训练过程中多个迭代轮次针对训练样本集各样本学习得到的表示向量;
根据每个迭代轮次学习到的所述训练样本集中各样本的表示向量,为所述第二样本子集中的各样本分别选择最相似的预设数量个样本,将为样本所选择的预设数量个相似样本加入与所述第二样本子集中各样本和迭代轮次对应的相似样本集;
针对所述第二样本子集中各样本对应的多个相似样本集,生成所述第二样本子集中各个样本对应的雅卡尔指数,将所述雅卡尔指数作为第二指标。
5.根据权利要求4所述的方法,其特征在于,所述性能评价指标包括第二指标;
则根据所述性能评价指标,确定所述表示学习模型的训练情况,包括:
当所述第二样本子集中大于雅卡尔指数阈值的样本占比超过预设比例时,确定所述表示学习模型的训练情况趋于稳定。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述性能评价指标包括第一指标和第二指标;
则根据所述性能评价指标,确定所述表示学习模型的训练情况,包括:
对所述第一指标和所述第二指标进行加权处理;
根据加权处理结果确定所述表示学习模型的训练情况。
7.根据权利要求1至5任一项所述的方法,其特征在于,所述方法还包括:
根据所述表示学习模型不同迭代轮次生成的所述性能评价指标,绘制并显示所述表示学习模型的训练效果曲线,所述训练效果曲线表示所述表示学习模型的性能随着训练进程的变化情况。
8.根据权利要求1至5任一项所述的方法,其特征在于,所述方法还包括:
针对配置有不同超参数的所述表示学习模型,生成不同迭代轮次的所述性能评价指标;
绘制并显示所述表示学习模型的对比效果图,所述对比效果图用于表现基于不同超参数的所述表示学习模型各自的训练效果曲线,所述训练效果曲线表示所述表示学习模型的性能随着训练进程的变化情况。
9.根据权利要求1至5任一项所述的方法,其特征在于,所述表示学习模型是词向量表示学习模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910549544.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于生成信息的方法和装置
- 下一篇:一种IT运维管理平台