[发明专利]文本分类模型调优的超参数推荐方法、装置及存储介质有效

申请号：	202110496595.4	申请日：	2021-05-07
公开（公告）号：	CN113220993B	公开（公告）日：	2023-09-26
发明（设计）人：	郝天永;雷顺威;瞿瑛瑛	申请（专利权）人：	华南师范大学
主分类号：	G06F16/9535	分类号：	G06F16/9535;G06F16/35;G06N3/0464;G06N3/08
代理公司：	广州嘉权专利商标事务所有限公司 44205	代理人：	黎扬鹏
地址：	510631 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文本分类模型参数推荐方法装置存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种文本分类模型调优的超参数推荐方法，其特征在于，包括：

根据文本分类模型的超参数类型，构建超参数组集；

根据所述文本分类模型的类别体系与分类性能指标，计算得到第一组数据，所述第一组数据包括类别体系权重信息和总体分类性能指标权重信息；

根据所述超参数组集，对所述文本分类模型进行训练与测试，得到第二组数据，所述第二组数据包括总体分类性能结果和类目分类性能结果集；

根据所述第一组数据，对所述第二组数据进行计算，得到第三组数据，所述第三组数据包括总体分类性能综合结果和类目分类性能综合结果；

对所述第三组数据进行排序，得到推荐的超参数组；

所述分类性能指标包括准确率、精准率、召回率、F值中的至少一种，所述根据所述文本分类模型的类别体系与分类性能指标，计算得到第一组数据这一步骤，包括：

获取所述文本分类模型的类别体系的集合为第一集合Y＝{y₁，...，y_i，...，y_n}；

构建第一判断矩阵，所述第一判断矩阵为n阶判断矩阵B＝(b_ij)_n×n，其中b_ij表示类别y_i对类别y_j的相对重要程度；

对所述第一判断矩阵B的每一列进行归一化处理，得到第二判断矩阵B′＝(b_ij′)_n×n；

其中，所述对所述构建的判断矩阵B的每一列进行归一化处理满足

对所述第二判断矩阵B′按列相加，得到第一特征向量W′＝(W₁′，...，W_i′，...，W_n′)^T；

对所述第一特征向量W′进行归一化处理，得到第二特征向量W＝(W₁，...，W_i，...，W_n)^T；

其中，所述对所述第一特征向量W′进行归一化处理满足

若所述第一集合的元素数量n大于第一预设值，根据所述第一判断矩阵B和所述第二特征向量W，计算得到所述第一判断矩阵B的最大特征根λ_max；

其中，所述最大特征根满足

根据所述最大特征根λ_max，计算所述第一判断矩阵B的一致性指标CI；

若所述第一集合的元素数量n小于第二预设值，根据平均随机一致性指标表格，查询所述第一判断矩阵B对应的平均随机一致性指标RI；

根据所述一致性指标CI和所述平均随机一致性指标RI，计算得到所述第一判断矩阵的一致性比率CR；

若所述一致性比率CR小于第三预设值，根据所述第二特征向量W＝(W₁，...，W_i，...，W_n)^T，计算得到所述第一集合对应的权重集合w＝(w₁，...，w_i，...，w_n)，所述权重集合为所述类别体系权重信息；

获取分类性能指标集为第二集合M＝{m₁，...，m_j，...，m_n}；

若所述F值在所述第二集合中，则执行以下步骤：

判断所述精准率和所述召回率是否在所述第二集合M中，若在，将所述精准率和所述召回率从所述第二集合M中移除；

计算所述召回率R相对于所述精准率P的相对重要程度β′；

对所述相对重要程度β′进行归一化处理，得到所述召回率R相对于所述精准率P的权重系数β；

根据所述精准率P、所述召回率R和所述权重系数β，计算得到带有权重的F值；

其中，所述带有权重的F值满足

若所述F值不在所述第二集合M中，则按照所述类别体系权重信息的获取方法，获取得到所述第二集合对应的总体分类性能指标权重集合z＝(z₁，...，z_j，...，z_n)，所述总体分类性能指标权重集合为所述总体分类性能指标权重信息；

若所述第一集合的元素数量n大于第二预设值，通过以下方式获取得到所述平均随机一致性指标；

构建n阶随机正互反矩阵A′；

计算所述n阶随机正互反矩阵的最大特征根的平均值，得到所述平均随机一致性指标RI；

所述根据所述第一组数据，对所述第二组数据进行计算，得到第三组数据这一步骤，包括：

根据所述总体分类性能指标权重信息，对所述总体分类性能结果进行计算，得到所述总体分类性能综合结果；

根据所述类别体系权重信息，对所述类目分类性能结果集进行计算，得到所述类目分类性能综合结果；

总体分类性能综合结果的获取过程为：

(1)获取分类性能指标M＝{m₁，...，m_j，...，m_n}，各超参数组的文本分类模型的总体分类性能结果为S_t＝{s_t1，...，s_tj，...，s_tn}，各超参数组的文本分类模型的总体分类性能指标权重集合为z＝(z₁，...，z_j，...，z_n)；

(2)计算文本分类模型的总体分类性能综合结果为

类目分类性能综合结果的获取过程为：

(1)获取类别集合Y＝{y₁，...，y_i，...，y_n}，各超参数组的文本分类模型的类目分类性能结果集为S_c＝{S_c1，...，S_ci，...，S_cn}，其中S_ci＝{s′_c1，...，s′_cj，...，s′_cn}表示类别y_i的分类性能结果集，类别集合Y的权重集合w＝(w₁，...，w_i，...，w_n)；