[发明专利]一种基于动态规划的分类器筛选方法、系统及计算机设备在审
申请号: | 202110797631.0 | 申请日: | 2021-07-14 |
公开(公告)号: | CN114330468A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 王天乐;徐维超;陈泽鹏;朱鸿斌 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/16;G06F16/35;G06N20/00 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 刘俊 |
地址: | 510090 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 动态 规划 分类 筛选 方法 系统 计算机 设备 | ||
本发明涉及一种基于动态规划的分类器筛选方法、系统及计算机设备,包括以下步骤:对样本数据进行排序处理,将其转化为向量矩阵;根据向量矩阵,用动态规划算法求得三类分类器ROC曲面下的VUS估计值;将VUS估计值和向量矩阵代入VUS方差表达式中求VUS方差值;根据VUS方差值来比较得到VUS最大估计值,并将最大估计值的分类器作为最优的分类器。对已有数据进行排序处理,将其转化为向量矩阵;根据向量矩阵,用动态规划算法求得三类分类器ROC曲面下的VUS估计值及其对应的方差值;比较在动态规划算法下求得的VUS最大估计值,将最大估计值的分类器作为最优的分类器,本方法是基于线性时间的,快于二次时间;与韦格曼方法相比,估计量是无偏的,使其计算负载更小。
技术领域
本发明涉及机器学习领域,更具体地,涉及一种基于动态规划的分类器筛选 方法、系统及计算机设备。
背景技术
分类在机器学习中是一个有监督的学习过程。所谓的分类问题,就比如我们 用机器学习算法,将病人的检查结果分为有病和健康,是一个医学方面的二分类 问题(将要区分的数据分为两个类别)。再例如在电子邮箱中,收到邮件之后, 电子邮箱会将我们的邮件分为广告邮件,垃圾邮件和正常邮件,这就是一个多分 类的问题。
接受者工作特性(ROC)分析在两类问题中得到了广泛的应用。根据不同的决 策阈值设置定义一个ROC曲线,这是假阳性率与真阳性率(灵敏度)的图。ROC曲 线下面积(AUC)可以通过分析或经验计算,作为一个指标来总结二元分类器的总 体性能。然而,在实践中经常遇到三类问题,特别是在区域医学中。为了评估三 类分类器的性能,研究者提出了三类ROC曲面下的体积(VUS)作为价值指标,其 他研究人员提出了各种方法来估计VUS的均值和方差。然而,就我们所知,现有 的方法都承受着沉重的计算负载。
中国发明专利CN107562880A公开了“一种基于多级分类器的分类结果筛选 方法及装置”,公开日为2018年01月09日:获取初始请求和多级分类器的分 类结果;所述分类结果为所述多级分类器对预测文本信息分类的结果;所述分类 结果包括x个分类路径的集合,x为大于或者等于1的正整数;使用与所述初始 请求相应的预设规则筛选所述分类结果,得到目标结果;输出所述目标结果,为 用户提供更加精准和符合需求的目标结果及预测文本信息,避免多级分类器的结 果过多对有用的信息进行干扰,提高文本分类的效率和效果,另外,筛选方法任 意组合,也可以满足复杂多方向的筛选需求。但是该方法使用多级分类器,用于 筛选任意组合,筛选方法的计算负载极大。
发明内容
本发明为解决现有的分类器筛选方法的计算负载大的技术缺陷,提供了一种 基于动态规划的分类器筛选方法、系统及计算机设备。
为实现以上发明目的,采用的技术方案是:
一种基于动态规划的分类器筛选方法,包括以下步骤:
S1:对样本数据进行排序处理,将其转化为向量矩阵;
S2:根据向量矩阵,用动态规划算法求得三类分类器ROC曲面下的VUS估计 值;
S3:将VUS估计值和向量矩阵代入VUS方差表达式中求VUS方差值;
S4:根据VUS方差值来比较得到VUS最大估计值,并将最大估计值的分类器 作为最优的分类器。
上述方案中,对已有数据进行排序处理,将其转化为向量矩阵;根据向量矩 阵,用动态规划算法求得三类分类器ROC曲面下的VUS估计值及其对应的方差值; 比较在动态规划算法下求得的VUS最大估计值,将最大估计值的分类器作为最优 的分类器,本方法是基于线性时间的,快于二次时间;与韦格曼方法相比,估计 量是无偏的,使其计算负载更小。
优选的,在步骤S1中,所述向量矩阵求解如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110797631.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于列修复的存储器件
- 下一篇:图像传感器