[发明专利]一种评估分类模型的方法和装置在审
| 申请号: | 201711121290.5 | 申请日: | 2017-11-14 |
| 公开(公告)号: | CN109784352A | 公开(公告)日: | 2019-05-21 |
| 发明(设计)人: | 王晨阳;陈福豪;寿如阳;林睿 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 张一军;陆锦华 |
| 地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 分类模型 类别数据 评估 方法和装置 数据集 计算机技术领域 输入数据集 参考数据 操作流程 模型开发 人工标注 自动化 分类 | ||
1.一种评估分类模型的方法,其特征在于,包括:
获取多个分类模型对输入数据集分类得到的多个第一类别数据集,每个第一类别数据集对应一分类模型;
根据预选的参考数据集确定各第一类别数据集中的假正例数据集;
根据各第一类别数据集和所述各第一类别数据集中的假正例数据集评估所述多个分类模型。
2.根据权利要求1所述的方法,其特征在于,所述参考数据集包括预设数量的第二类别数据集,
根据预选的参考数据集确定各第一类别数据集中的假正例数据集的步骤,包括:
根据所述预设数量的第二类别数据集与所述各第一类别数据集的交集确定所述各第一类别数据集中的假正例数据集。
3.根据权利要求2所述的方法,其特征在于,根据各第一类别数据集和所述各第一类别数据集中的假正例数据集评估所述多个分类模型的步骤,包括:
根据每个第一类别数据集和所述第一类别数据集中的假正例数据集计算所述第一类别数据集对应的分类模型的误分类率;
根据各分类模型的误分类率评估所述各分类模型。
4.根据权利要求3所述的方法,其特征在于,每个第一类别数据集对应的分类模型的各个误分类率分别对应一第二类别数据集,
根据各分类模型的误分类率评估所述各分类模型的步骤,包括:
每次从所述多个分类模型中选取两个分类模型,比对所述两个分类模型的对应相同第二类别数据集的各误分类率;
统计所述两个分类模型的各次比较的结果中,每个分类模型的各误分类率作为较大值出现的次数和作为较小值出现的次数,将所述两个分类模型中,各误分类率作为较大值出现的次数小于作为较小值出现的次数的一个分类模型评估为高精度模型,直到评估出所述多个分类模型中任意两个分类模型中的高精度模型,从而完成对所有分类模型的评估。
5.根据权利要求2所述的方法,其特征在于,所述参考数据集至少满足如下条件:
在所述参考数据集与所述输入数据集之间的公共数据集中,所述第二类别数据集的数据数量在所述公共数据集中的占比大于预设阈值;
所述公共数据集中的数据分布特征与所述输入数据集中的数据分布特征相同。
6.一种评估分类模型的装置,其特征在于,包括:
获取模块,用于获取多个分类模型对输入数据集分类得到的多个第一类别数据集,每个第一类别数据集对应一分类模型;
确定模块,用于根据预选的参考数据集确定各第一类别数据集中的假正例数据集;
评估模块,用于根据各第一类别数据集和所述各第一类别数据集中的假正例数据集评估所述多个分类模型。
7.根据权利要求6所述的装置,其特征在于,所述参考数据集包括预设数量的第二类别数据集,
所述确定模块还用于:
根据所述预设数量的第二类别数据集与所述各第一类别数据集的交集确定所述各第一类别数据集中的假正例数据集。
8.根据权利要求7所述的装置,其特征在于,所述评估模块还用于:
根据每个第一类别数据集和所述第一类别数据集中的假正例数据集计算所述第一类别数据集对应的分类模型的误分类率;
根据各分类模型的误分类率评估所述各分类模型。
9.根据权利要求8所述的装置,其特征在于,每个第一类别数据集对应的分类模型的各个误分类率分别对应一第二类别数据集,
所述评估模块包括模型评估单元,用于:
每次从所述多个分类模型中选取两个分类模型,比对所述两个分类模型的对应相同第二类别数据集的各误分类率;
统计所述两个分类模型的各次比较的结果中,每个分类模型的各误分类率作为较大值出现的次数和作为较小值出现的次数,将所述两个分类模型中,各误分类率作为较大值出现的次数小于作为较小值出现的次数的一个分类模型评估为高精度模型,直到评估出所述多个分类模型中任意两个分类模型中的高精度模型,从而完成对所有分类模型的评估。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711121290.5/1.html,转载请声明来源钻瓜专利网。





