[发明专利]一种基于决策树数据挖掘算法的复杂岩性识别方法及系统在审
申请号: | 201710266077.7 | 申请日: | 2017-04-21 |
公开(公告)号: | CN107133670A | 公开(公告)日: | 2017-09-05 |
发明(设计)人: | 谭锋奇 | 申请(专利权)人: | 中国科学院大学 |
主分类号: | G06N5/02 | 分类号: | G06N5/02;E21B49/00 |
代理公司: | 北京轻创知识产权代理有限公司11212 | 代理人: | 杨立,姜海荣 |
地址: | 100049 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 决策树 数据 挖掘 算法 复杂 识别 方法 系统 | ||
技术领域
本发明涉及石油勘探储层评价技术领域,尤其涉及一种基于决策树数据挖掘算法的复杂岩性识别方法及系统。
背景技术
随着石油勘探开发广度和深度的拓展,一方面石油数据以飞快的速度不断积累,海量的石油数据作为一种财富的载体如果加以充分利用,可以给石油勘探与开发带来额外的效益,传统的基于岩石物理学、数理学、统计学、石油勘探理论的地球物理勘探方法对于深化利用这些海量数据显得有些无能为力;另一方面各种非常规油气藏正成为主力勘探对象,对于这些复杂油气藏,常规的交会图、线性回归、多元判别分析等方法并不能有效地解决岩性识别、储层参数计算等难题。因此,石油勘探开发中有必要引入人工智能、机器学习、模式识别等其它研究领域的新方法,数据挖掘作为一种“数据驱动”的解决方法,可以很好地解决复杂油气藏评价中遇到的各种难题。
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含的、事先未知的、但又是潜在有用信息和知识的过程。数据挖掘任务分为描述和预测两大类,前者导出数据中潜在关系的概括模式,后者对当前数据进行推断以做出预测,主要方法有神经网络、支持向量机、贝叶斯网络和决策树等,其中神经网络己经广泛应用于岩性识别、沉积相划分、渗透率预测、油气水层识别等方面,实践证明,当处理多种因素影响的复杂石油地质问题时,非线性的神经网络方法要比线性的统计分析技术优越。但是神经网络有个最大的缺点就是容易对训练样本“过学习”,方法的可变参数太多,如果给算法足够的时间,它几乎可以“记住”任何事情,这样建立的模型就会脱离地质背景,没有实际的应用价值;另外,神经网络、支持向量机和贝叶斯网络还有一个共同的缺点就是预测的模型都属于“黑盒”,样本数据和属性之间以怎样的方式和关系拟合是看不到的。
发明内容
本发明为了解决上述技术问题,提供一种基于决策树数据挖掘算法的复杂岩性识别方法及系统。
本发明解决上述技术问题的技术方案如下:一种基于决策树数据挖掘算法的复杂岩性识别方法,所述方法包括:
建立密闭取心井段的岩性剖面,根据岩性剖面形成岩性识别数据集;
对所述岩性识别数据集进行数据预处理;
以不同的测井参数分别对应岩性识别数据集中的不同岩性;
对预处理之后的岩性识别数据集中的岩性进行数据挖掘,形成树状识别模型,从而根据所述树状识别模型以及测井参数所对应的岩性对复杂岩性进行识别。
本发明的有益效果是:本发明通过岩性剖面形成岩性识别数据集,进行统一岩性识别,并根据岩性的特点对应不同的测井参数,在对岩性识别数据集进行数据挖掘后,形成清晰明了的树状识别模型,能够在复杂岩性状况下进行精准岩性识别。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,在建立密闭取心井段的岩性剖面后,依据厚层、薄夹层和岩性过渡带的测井读值原则分别读取不同岩性段的测井曲线响应值,建立砾岩岩性与测井参数的对应关系,形成岩性识别数据集。
进一步,对所述岩性识别数据集进行数据预处理的过程包括补齐缺失值、整体标准化以及消除异常点。
采用上述进一步方案的有益效果是:薄夹层的存在和岩性过渡带上测井响应的影响都会造成数据异常,因此,需要将异常点进行消除以便精准识别。
进一步,采用决策树算法对预处理之后的岩性识别数据集中的岩性进行数据挖掘。
采用上述进一步方案的有益效果是:决策树算法属于“白盒”封存模型,可以清楚的了解到分类器是如何工作以及测井参数的重要性。对于非均质性严重、岩性复杂多变的油气储层,传统的数理统计方法难以准确地反映测井曲线与岩性之间的非线性映射关系,而具有自组织、自学习、推理思维能力和非线性建模的决策树方法能够很好地解决这个问题,为储层评价提供高精度的岩性识别结果,保证复杂油气藏合理高效开发。
进一步,对预处理之后的岩性识别数据集中的岩性进行数据挖掘的过程为:计算出每个测井参数在岩性识别中的权重,获得敏感参数进行建模,最后以表征方式自上而下建立树状识别模型,其中树的每一个分支代表一类岩性的识别规则,叶节点表示构成该识别规则的测井参数以及每个测井参数的数值区间。
采用上述进一步方案的有益效果是:通过对不同测井参数的权重进行分析进而自动优选出岩性敏感参数,最终建立兼顾模型识别精度与样本泛化能力的复杂岩性识别模型,为储层综合评价提供重要的地质依据。
为了解决上述技术问题,本发明还提出一种基于决策树数据挖掘算法的复杂岩性识别系统,所述系统包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院大学,未经中国科学院大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710266077.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置