[发明专利]分类模型评价指标的确定方法、装置、设备及介质有效
| 申请号: | 202010362361.6 | 申请日: | 2020-04-30 |
| 公开(公告)号: | CN111582351B | 公开(公告)日: | 2023-09-22 |
| 发明(设计)人: | 何天健;刘毅;董大祥;马艳军;于佃海 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G06F18/21 | 分类号: | G06F18/21;G06F18/241 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 分类 模型 评价 指标 确定 方法 装置 设备 介质 | ||
1.一种分类模型评价指标的确定方法,其特征在于,包括:
获取分类模型的当前样本集;
将所述当前样本集以及与所述当前样本集连续获取的固定数量个历史样本集,作为当前滑动窗口;
确定所述当前样本集对应的分桶计数信息;
根据所述当前样本集对应的分桶计数信息,以及上一滑动窗口的累积分桶计数信息,确定所述当前滑动窗口的累积分桶计数信息;其中,滑动窗口中每个样本集的分桶计数信息,采用滚动数组的方式复用存储空间进行存储;
根据所述当前滑动窗口的累积分桶计数信息,确定所述分类模型的当前评价指标值;其中,不同分桶对应的计算任务,分别分配给GPU中不同的线程进行并行处理。
2.根据权利要求1所述的方法,其特征在于,根据所述当前样本集对应的分桶计数信息,以及上一滑动窗口的累积分桶计数信息,确定所述当前滑动窗口的累积分桶计数信息,包括:
根据所述上一滑动窗口的累积分桶计数信息、所述上一滑动窗口中首个样本集对应的分桶计数信息和当前样本集对应的分桶计数信息,确定所述当前滑动窗口的累积分桶计数信息;
其中,所述首个样本集为所述上一滑动窗口中获取时间距离当前系统时间最远的样本集。
3.根据权利要求1所述的方法,其特征在于,所述当前滑动窗口的累积分桶计数信息包括所述当前滑动窗口的正样本累积分桶计数数组以及负样本累积分桶计数数组;
相应地,根据所述当前滑动窗口的累积分桶计数信息,确定所述分类模型的当前评价指标值,包括:
根据所述当前滑动窗口的正样本累积分桶计数数组以及负样本累积分桶计数数组,确定所述当前滑动窗口中正样本的预测值大于负样本的预测值时的累加计数信息;
根据所述累加计数信息以及正负样本对组合数量,确定所述当前滑动窗口中所述分类模型的曲线下面积AUC值。
4.根据权利要求3所述的方法,其特征在于,根据所述当前滑动窗口的正样本累积分桶计数数组以及负样本累积分桶计数数组,确定所述当前滑动窗口中正样本的预测值大于负样本的预测值时的累加计数信息,包括:
根据所述当前滑动窗口的负样本累积分桶计数数组,构建负样本前缀计数数组;
根据所述负样本前缀计数数组,以及所述正样本累积分桶计数数组,确定所述当前滑动窗口的累加计数数组;其中,所述累加计数数组为所述当前滑动窗口中各个分桶对应正样本的预测值大于负样本的预测值时的累加计数所组成的数组;
对所述累加计数数组中各元素数值进行求和处理,得到累加计数信息。
5.根据权利要求4所述的方法,其特征在于,根据所述当前滑动窗口的负样本累积分桶计数数组,构建负样本前缀计数数组,包括:
根据第一计算公式:t[i]=A[i-2k+1]+A[i-2k+2]+…+A[i],构建负样本树状数组;其中,A为所述负样本累积分桶计数数组,t为所述负样本树状数组,i为数组位数索引值,k为i的二进制表示中从最低位到高位连续零的长度;
根据第二计算公式:构建负样本前缀计数数组;其中,f为所述负样本前缀计数数组,t为所述负样本树状数组,i为数组位数索引值,k1为i的二进制表示中从低位数出现第1个1的位数,k2为i的二进制表示中从低位数出现第2个1的位数,直到t的索引为2的幂。
6.根据权利要求4所述的方法,其特征在于,根据所述负样本前缀计数数组,以及所述正样本累积分桶计数数组,确定所述当前滑动窗口的累加计数数组,包括:
根据第三计算公式:value[i]=pos[i]*(f[i]+f[i-1])*0.5,确定所述当前滑动窗口的累加计数数组;
其中,value为所述累加计数数组,f为所述负样本前缀和数组,pos为所述正样本累积分桶计数数组,i为数组位数索引值。
7.根据权利要求4-6任一项所述的方法,其特征在于,还包括:
将所述负样本前缀和数组和/或累加计数数组中不同分桶对应的计算任务,分别分配给不同的线程进行并行处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010362361.6/1.html,转载请声明来源钻瓜专利网。





