[发明专利]一种基于动态规划的分类器筛选方法、系统及计算机设备在审

专利信息
申请号: 202110797631.0 申请日: 2021-07-14
公开(公告)号: CN114330468A 公开(公告)日: 2022-04-12
发明(设计)人: 王天乐;徐维超;陈泽鹏;朱鸿斌 申请(专利权)人: 广东工业大学
主分类号: G06K9/62 分类号: G06K9/62;G06F17/16;G06F16/35;G06N20/00
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 刘俊
地址: 510090 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 动态 规划 分类 筛选 方法 系统 计算机 设备
【说明书】:

本发明涉及一种基于动态规划的分类器筛选方法、系统及计算机设备,包括以下步骤:对样本数据进行排序处理,将其转化为向量矩阵;根据向量矩阵,用动态规划算法求得三类分类器ROC曲面下的VUS估计值;将VUS估计值和向量矩阵代入VUS方差表达式中求VUS方差值;根据VUS方差值来比较得到VUS最大估计值,并将最大估计值的分类器作为最优的分类器。对已有数据进行排序处理,将其转化为向量矩阵;根据向量矩阵,用动态规划算法求得三类分类器ROC曲面下的VUS估计值及其对应的方差值;比较在动态规划算法下求得的VUS最大估计值,将最大估计值的分类器作为最优的分类器,本方法是基于线性时间的,快于二次时间;与韦格曼方法相比,估计量是无偏的,使其计算负载更小。

技术领域

本发明涉及机器学习领域,更具体地,涉及一种基于动态规划的分类器筛选 方法、系统及计算机设备。

背景技术

分类在机器学习中是一个有监督的学习过程。所谓的分类问题,就比如我们 用机器学习算法,将病人的检查结果分为有病和健康,是一个医学方面的二分类 问题(将要区分的数据分为两个类别)。再例如在电子邮箱中,收到邮件之后, 电子邮箱会将我们的邮件分为广告邮件,垃圾邮件和正常邮件,这就是一个多分 类的问题。

接受者工作特性(ROC)分析在两类问题中得到了广泛的应用。根据不同的决 策阈值设置定义一个ROC曲线,这是假阳性率与真阳性率(灵敏度)的图。ROC曲 线下面积(AUC)可以通过分析或经验计算,作为一个指标来总结二元分类器的总 体性能。然而,在实践中经常遇到三类问题,特别是在区域医学中。为了评估三 类分类器的性能,研究者提出了三类ROC曲面下的体积(VUS)作为价值指标,其 他研究人员提出了各种方法来估计VUS的均值和方差。然而,就我们所知,现有 的方法都承受着沉重的计算负载。

中国发明专利CN107562880A公开了“一种基于多级分类器的分类结果筛选 方法及装置”,公开日为2018年01月09日:获取初始请求和多级分类器的分 类结果;所述分类结果为所述多级分类器对预测文本信息分类的结果;所述分类 结果包括x个分类路径的集合,x为大于或者等于1的正整数;使用与所述初始 请求相应的预设规则筛选所述分类结果,得到目标结果;输出所述目标结果,为 用户提供更加精准和符合需求的目标结果及预测文本信息,避免多级分类器的结 果过多对有用的信息进行干扰,提高文本分类的效率和效果,另外,筛选方法任 意组合,也可以满足复杂多方向的筛选需求。但是该方法使用多级分类器,用于 筛选任意组合,筛选方法的计算负载极大。

发明内容

本发明为解决现有的分类器筛选方法的计算负载大的技术缺陷,提供了一种 基于动态规划的分类器筛选方法、系统及计算机设备。

为实现以上发明目的,采用的技术方案是:

一种基于动态规划的分类器筛选方法,包括以下步骤:

S1:对样本数据进行排序处理,将其转化为向量矩阵;

S2:根据向量矩阵,用动态规划算法求得三类分类器ROC曲面下的VUS估计 值;

S3:将VUS估计值和向量矩阵代入VUS方差表达式中求VUS方差值;

S4:根据VUS方差值来比较得到VUS最大估计值,并将最大估计值的分类器 作为最优的分类器。

上述方案中,对已有数据进行排序处理,将其转化为向量矩阵;根据向量矩 阵,用动态规划算法求得三类分类器ROC曲面下的VUS估计值及其对应的方差值; 比较在动态规划算法下求得的VUS最大估计值,将最大估计值的分类器作为最优 的分类器,本方法是基于线性时间的,快于二次时间;与韦格曼方法相比,估计 量是无偏的,使其计算负载更小。

优选的,在步骤S1中,所述向量矩阵求解如下:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110797631.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top