[发明专利]文本分类模型调优的超参数推荐方法、装置及存储介质有效
申请号: | 202110496595.4 | 申请日: | 2021-05-07 |
公开(公告)号: | CN113220993B | 公开(公告)日: | 2023-09-26 |
发明(设计)人: | 郝天永;雷顺威;瞿瑛瑛 | 申请(专利权)人: | 华南师范大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/35;G06N3/0464;G06N3/08 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 黎扬鹏 |
地址: | 510631 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 分类 模型 参数 推荐 方法 装置 存储 介质 | ||
本发明公开了一种文本分类模型调优的超参数推荐方法、装置及存储介质,该方法包括根据文本分类模型的超参数类型,构建超参数组集;根据文本分类模型的类别体系与分类性能指标,计算得到第一组数据,第一组数据包括类别体系权重信息和总体分类性能指标权重信息;根据超参数组集,对文本分类模型进行训练与测试,得到第二组数据,第二组数据包括总体分类性能结果和类目分类性能结果集;根据第一组数据,对第二组数据进行计算,得到第三组数据,第三组数据包括总体分类性能综合结果和类目分类性能综合结果;对第三组数据进行排序,得到推荐的超参数组;本发明能够提高深度学习文本分类模型调优的效率;本发明可广泛应用于机器学习领域。
技术领域
本发明涉及机器学习领域,尤其是一种文本分类模型调优的超参数推荐方法、装置及存储介质。
背景技术
文本分类是机器学习领域尤其是自然语言处理中的一项重要任务,深度学习文本分类模型性能表现通常与超参数的选择密切相关。超参数的选择一般在模型训练前由人工确定,模型经过训练测试后,再根据测试的性能结果对超参数进行调整,重新进行模型训练,对比超参数调整前后的结果差异,确定最终的超参数组合。在深度学习文本分类中,由于超参数的种类众多,人工调整超参数的方式效率通常比较低下,难以快速、便捷、准确地得到最优的超参数组合。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种文本分类模型调优的超参数推荐方法、装置及存储介质。
本发明所采取的技术方案是:
一方面,本发明实施例包括一种文本分类模型调优的超参数推荐方法,包括:
根据文本分类模型的超参数类型,构建超参数组集;
根据所述文本分类模型的类别体系与分类性能指标,计算得到第一组数据,所述第一组数据包括类别体系权重信息和总体分类性能指标权重信息;
根据所述超参数组集,对所述文本分类模型进行训练与测试,得到第二组数据,所述第二组数据包括总体分类性能结果和类目分类性能结果集;
根据所述第一组数据,对所述第二组数据进行计算,得到第三组数据,所述第三组数据包括总体分类性能综合结果和类目分类性能综合结果;
对所述第三组数据进行排序,得到推荐的超参数组。
进一步地,所述超参数类型包括离散型超参数和连续型超参数,所述根据文本分类模型的超参数类型,构建超参数组集这一步骤,具体包括:
使用穷举法枚举所有取值范围,构建离散型超参数取值集合;
根据预设的取值范围和预设的步长,进行离散化处理,构建连续型超参数取值集合;
对所述离散型超参数取值集合和所述连续型超参数取值集合进行排列组合,得到所述超参数组集。
进一步地,所述分类性能指标包括准确率、精准率、召回率、F值中的至少一种,所述根据所述文本分类模型的类别体系与分类性能指标,计算得到第一组数据这一步骤,包括:
获取所述文本分类模型的类别体系的集合为第一集合;
构建第一判断矩阵,所述第一判断矩阵为n阶判断矩阵;
对所述第一判断矩阵的每一列进行归一化处理,得到第二判断矩阵;
对所述第二判断矩阵按列相加,得到第一特征向量;
对所述第一特征向量进行归一化处理,得到第二特征向量;
若所述第一集合的元素数量大于第一预设值,根据所述第一判断矩阵和所述第二特征向量,计算得到所述第一判断矩阵的最大特征根;
根据所述最大特征根,计算所述第一判断矩阵的一致性指标;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南师范大学,未经华南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110496595.4/2.html,转载请声明来源钻瓜专利网。