[发明专利]基于设置正负例错分值的百分比的可控置信机器算法在审
| 申请号: | 201510202142.0 | 申请日: | 2015-04-24 |
| 公开(公告)号: | CN104820838A | 公开(公告)日: | 2015-08-05 |
| 发明(设计)人: | 蒋方纯 | 申请(专利权)人: | 深圳信息职业技术学院 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 刘朗星 |
| 地址: | 518029 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 设置 正负 分值 百分比 可控 置信 机器 算法 | ||
1.一种基于设置正负例错分值的百分比的可控置信机器算法,其特征在于,所述方法包括如下步骤:
接收二元训练数据样本和二元训练样本标签构成的训练集Train Set;
根据所述训练集Train Set训练二元分类器,得到二元分类器参数值;
根据所述二元分类器在所述训练集Train Set上分类,并将分类结果转换成输出值Output score;
从原点出发向左,通过逐步增加第一距离的步长,以及通过以原点出发,向右逐步增加第二距离的步长,确定满足要求的阈值范围(-t2,t1),其中,所述第一距离为原点至正例错分的最小的Score值的距离的第一预定比例值,所述第二距离为原点至负例错分的最大的Score值的距离的第二预定比例值;
获取未知二元样本,根据所述二元分类器对未知二元样本进行分类,并将分类结果转换成输出值Output score;
如果所述未知二元样本的输出值Output score属于该阈值范围,将未知样本分配到拒绝域,如未知二元样本的输出值Output Score不属于该阈值范围,将未知样本分配到接受域。
2.根据权利要求1所述方法,其特征在于,所述从原点出发向左,通过逐步增加第一距离的步长,以及通过以原点出发,向右逐步增加第二距离的步长,确定满足要求的阈值范围步骤为:
根据所述第一距离、第二距离的步长和预设的正确率,以原点为基准,以第一距离的步长逐步向左、以第二距离的步长向右逐步移动阈值范围,当移动的阈值范围对应的正确率大于预设的正确率时,确定阈值(-t2,t1)为未知二元样本对应的阈值范围。
3.根据权利要求2所述的方法,其特征在于,所述以第一距离的步长逐步向左、以第二距离的步长向右逐步移动阈值范围具体为:
如以第一距离的步长向左移动阈值范围的已知二元样本的错分率多,则先以第一距离的步长向左移动阈值,然后再向右以第二距离的步长移动阈值;
如以第二步长向右移动阈值范围的已知二元样本的错分率多,则先以第二距离的步长向右移动阈值,然后再以第一距离的步长向左移动阈值。
4.根据权利要求1-3任一项所述方法,其特征在于,所述第一预定比例值和第二预定比例值相同或不同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳信息职业技术学院,未经深圳信息职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510202142.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:适用于PCB制造的追溯系统
- 下一篇:一种检测视频险情的方法及装置





