[发明专利]一种基于集成机器学习高效预测钙钛矿的稳定性的方法在审
| 申请号: | 202110274708.6 | 申请日: | 2021-03-15 |
| 公开(公告)号: | CN113052367A | 公开(公告)日: | 2021-06-29 |
| 发明(设计)人: | 林彬;邓钦 | 申请(专利权)人: | 电子科技大学 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06K9/62;G06N20/00 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 集成 机器 学习 高效 预测 钙钛矿 稳定性 方法 | ||
1.一种基于集成机器学习高效预测钙钛矿的稳定性的方法,其特征在于,包括如下步骤:
1)建立数据集:
从文献和数据库中收集钙钛矿材料的稳定性和其他特征的数据,作为机器学习的数据集样本;
2)对数据进行预处理并选出建模的特征子集:
将所述步骤1)中的数据集进行预处理,对缺损数值的样本数据进行删除,并将完整的数据样本值进行皮尔逊相关系数分析,找到与稳定性相关性强的特征,作为建模的特征子集;
3)将所述步骤2)中得到的特征子集样本按5:1的比例,随机划分为训练集和测试集;
4)构建高效预测模型:
结合AdaBoost,CatBoost,XGBoost,GBR四种机器学习算法,设计了一种稳定高效的新型集成学习方法,利用此方法和步骤3)中得到的训练集进行建模,得到最优的钙钛矿稳定性预测模型;
5)预测测试集样本的带隙;
根据在所述步骤5)中建立的钙钛矿稳定性的预测模型,预测在所述步骤4)中得到的测试集样本的稳定性。
2.根据权利要求1所述基于集成机器学习快速预测钙钛矿稳定性的方法,在所述步骤2)中皮尔逊相关系数分析原理如下:
皮尔逊相关系数为两个变量之间的协方差和标准差的商,是用于度量两个变量之间的相关(线性相关)程度,其值介于-1与1之间,相关值为1表示在正方向上有很强的相关性,相关值为-1表示在负方向上有很强的相关性,相关值接近于0表示特征之间没有相关性。
3.根据权利要求1所述基于集成机器学习快速预测钙钛矿稳定性的方法,在所述步骤3)中结合AdaBoost,CatBoost,XGBoost,GBR四种机器学习算法,设计了一种稳定高效的新型集成学习方法,AdaBoost,CatBoost,XGBoost,GBR原理如下:
Adaboost算法在样本训练集使用过程中,对其中的关键分类特征集进行多次挑选,逐步训练分量弱分类器,用适当的阈值选择最佳弱分类器,最后将每次迭代训练选出的最佳弱分类器构建为强分类器;CatBoost算法在梯度提升树算法的基础上,利用组合类别特征,使用更有效的策略以减少过度拟合,同时使用整个数据集参与训练,对数据信息进行了有效利用,前一个基本分类器被错误分类的样本权重会增大,而正确分类的样本的权重会减小,并且再次用来训练下一个基本分类器,在每一轮迭代中,加入一个新的弱分类器,直到达到某个预定的足够小的错误率或达到预先指定的最大迭代次数才可以最终确定最终的强分类器;XGBoost算法基于梯度提升树进行了改进,提升了算法的准确度和运行速度,支持并行计算,大大提高了算法的运行效率,在损失函数中加入了正则项,用来控制模型的复杂度,进而可以防止模型的过拟合;GBR算法通过添加新的回归树以最小化每次迭代中的目标函数,每棵新树都是在上一棵树的残差上进行学习,并且都沿着损失函数的负梯度方向进行训练,通过多次迭代,训练多个弱学习器,最终将这些弱学习器进行线性组合产生一个强学习器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110274708.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电控多模块城市沙盘
- 下一篇:一种畜牧业环绕清洗装置
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





