[发明专利]基于XGBOOST算法与特征工程的岩性及流体类型识别方法有效
申请号: | 202010392710.9 | 申请日: | 2020-05-11 |
公开(公告)号: | CN111753871B | 公开(公告)日: | 2022-12-16 |
发明(设计)人: | 赵峦啸;邹采枫;陈远远;王一戎;陈怀震;张丰收;耿建华 | 申请(专利权)人: | 同济大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F30/27;G06N20/20;G06N3/08;G01V11/00 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 杨宏泰 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 xgboost 算法 特征 工程 流体 类型 识别 方法 | ||
1.一种基于XGBOOST算法与特征工程的岩性及流体类型识别方法,其特征在于,包括以下步骤:
1)根据钻井或测井数据获取地层的岩性及流体类型标签以及对应的弹性参数数据构建岩性及流体类型-弹性参数的学习样本;
2)特征构造:根据弹性参数利用数学变换构造特征集合;
3)特征选择:结合嵌入式特征选择与包裹式特征选择策略,在特征集合中选择最终的输入特征;
4)通过XGBOOST算法构建多井岩性和流体识别的机器学习模型进行学习并输出岩性及流体类型识别结果;
所述的岩性及流体类型包括泥岩、含水砂岩和含气砂岩,所述的弹性参数包括纵波阻抗IP和横波阻抗IS;
所述的特征集合具体为:
在特征集合中,IP+IS、IP-IS、IP*IS三项属性为纵横波阻抗通过数学运算构造所得,为纵横波阻抗比,IP2-2IS2、IPsin160°+IScos160°均为弹性属性-流体指示因子,为弹性属性泊松比;
所述的步骤3)具体包括以下步骤:
31)在嵌入式特征选择框架下,对所有的测井数据,采用XGBOOST算法对特征的重要性进行排序;
32)在包裹式特征选择框架下,根据排序后的特征构造特征子集,并采用XGBOOST算法进行模型训练和测试,统计岩性及流体类型识别的总体准确率、F1分数以及每种类别对应的F1分数;
33)根据总体准确率、F1分数选择最终的输入特征。
2.根据权利要求1所述的一种基于XGBOOST算法与特征工程的岩性及流体类型识别方法,其特征在于,所述的步骤31)中,采用XGBOOST算法对特征的重要性进行排序具体为:
在树的每个分裂节点处,获取对应特征的增益,将特征在所有树的增益加和后除以被选择的次数,即得到该特征重要性的量化值,并按照量化值大小进行排序。
3.根据权利要求1所述的一种基于XGBOOST算法与特征工程的岩性及流体类型识别方法,其特征在于,所述的步骤32)中,以纵波阻抗和纵横波速度比构建对照组进行训练和测试。
4.根据权利要求1所述的一种基于XGBOOST算法与特征工程的岩性及流体类型识别方法,其特征在于,所述的步骤32)中,对排序后的特征按特征重要性降序依次选择前1、2、…、10个特征分别构成特征子集。
5.根据权利要求4所述的一种基于XGBOOST算法与特征工程的岩性及流体类型识别方法,其特征在于,所述的步骤32)中,在特征子集中随机选取75%的数据作为训练集,剩下25%作为测试集,采用XGBOOST算法进行模型训练和测试。
6.根据权利要求1所述的一种基于XGBOOST算法与特征工程的岩性及流体类型识别方法,其特征在于,所述的步骤33)中,选择总体准确率、F1分数中位数最高且耗时合理的特征作为最终的输入特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010392710.9/1.html,转载请声明来源钻瓜专利网。