[发明专利]一种基于逻辑回归的分类方法及装置在审
申请号: | 202011318984.X | 申请日: | 2020-11-23 |
公开(公告)号: | CN112465001A | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 谢春;许伟 | 申请(专利权)人: | 上海电气集团股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 李静文 |
地址: | 200336 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 逻辑 回归 分类 方法 装置 | ||
本申请公开了一种基于逻辑回归的分类方法及装置。该方法中将目标对象的特征数据,分别输入目标对象对应的已训练的每种类别的二分类模型,得到目标对象属于每种类别的概率值;二分类模型是基于逻辑回归算法对目标对象对应的训练样本训练得到的;根据目标对象属于每种类别的概率值,获取目标对象的概率序列;检测概率序列是否满足预设条件,并根据检测结果,确定概率序列中的目标概率,并将目标概率对应的类别确定为目标对象的预测类别。该方法通过对现有技术的分类方式进行改进和优化,提高了分类结果的准确度。
技术领域
本申请涉及数据处理技术领域,尤其涉及一种基于逻辑回归的分类方法及装置。
背景技术
逻辑回归是一种广义的线性回归分析模型,常用于数据挖掘,设备故障类型自动诊断等领域。例如,探讨引发设备故障的危险因素,并根据危险因素预测故障发生的概率等。逻辑回归是一种二分类算法,一般用来解决二分类问题,但是它也可以用来解决多分类问题,当使用它来解决多分类问题的时候,由于逻辑回归的特点,一般将多分类问题转化为二分类问题,通过多分类拆分策略,可以使用逻辑回归来进行多分类问题的分析。目前常用的多分类拆分策略主要包括one vs rest策略和one vs one策略。
以多分类问题中最简单的三分类问题为例,针对三分类问题,由于分类类别相对较少,样本不平衡表现不明显,因此多采用one vs rest策略。
其中,在one vs rest策略中,假设有n个类别,那么就会建立n个二分类模型,每个二分类模型针对其中一个类别和剩余类别进行分类。进行预测时,利用这n个二分类模型进行分类,得到输入数据属于当前类的概率,选择最大概率对应的类别作为最终的预测结果。例如,天气的种类分为晴天、雨天、阴天和雪天。按照one vs rest策略进行分类为:
第一个二分类模型将晴天和非晴天:雨天、阴天、雪天进行分类;
第二个二分类模型将雨天和非雨天:阴天、晴天、雪天进行分类;
第三个二分类模型将阴天和非阴天:晴天、雨天、雪天进行分类;
第四个二分类模型将雪天和非雪天:阴天、晴天、雨天进行分类;
第一个二分类模型输出:晴天=85%,非晴天=15%;
第二个二分类模型输出:雨天=75%,非雨天=25%;
第三个二分类模型输出:阴天=60%,非阴天=30%;
第四个二分类模型输出:雪天=5%,非雪天=95%;
由于晴天的概率最大,故晴天为预测结果。
然而,使用one vs rest策略解决三分类问题,由于分类结果是取所有二分类模型中概率最大的类型作为其结果,当两个二分类模型的阳性样本(即样本标签为1)的概率相差不大时,通常会出现判断错误,导致分类结果准确度降低。
发明内容
本申请实施例提供一种基于逻辑回归的分类方法及装置,解决了现有技术存在的上述问题,实现基于逻辑回归对目标对象至少三种类别的分类,提高了分类结果的准确度。
第一方面,提供了一种基于逻辑回归的分类方法,该方法可以包括:
获取目标对象的特征数据;所述目标对象包括至少三种类别,且每种类别的所述目标对象的相应特征数据的特征值不同;
将所述特征数据,分别输入所述目标对象对应的已训练的每种类别的二分类模型,得到所述目标对象属于所述每种类别的概率值;所述二分类模型是基于逻辑回归算法对所述目标对象对应的训练样本训练得到的;
根据所述目标对象属于每种类别的概率值,获取所述目标对象的概率序列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海电气集团股份有限公司,未经上海电气集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011318984.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种视频播放方法、装置、设备及存储介质
- 下一篇:带有落冰机构的雪花制冰机