[发明专利]基于样本失衡的深度学习矿产资源分类预测方法及系统在审
申请号: | 202210640643.7 | 申请日: | 2022-06-08 |
公开(公告)号: | CN114997501A | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 张鹏程;陈豪;丁亮;张婧玉;邓继 | 申请(专利权)人: | 河海大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/02;G06V10/762;G06V10/764;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 孟红梅 |
地址: | 210024 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 样本 失衡 深度 学习 矿产资源 分类 预测 方法 系统 | ||
1.一种基于样本失衡的深度学习矿产资源分类预测方法,其特征在于,包括如下步骤:
步骤1:经由地理位置信息和地球化学元素信息形成矿靶区地质图像数据;
步骤2:将研究区域分为矿床区、成矿远景区和背景区;
步骤3:通过变分自编码器分析成矿远景区内化探数据的特征分布并确定成矿远景区内化探数据异常的区域,若成矿远景区中存在化探数据异常的区域,则将该区域的类别标记为与其距离最近的矿床区类别相同;
步骤4:将矿床区和所得化探异常区的样本进行数据增强;
步骤5:构造卷积神经网络模型,用于学习化探数据与矿化之间的规律,为防止神经网络模型对背景区的空间数据特征产生过拟合以及优化网络模型学习化探数据的成矿特征,引入损失权重和惩罚损失改进传统交叉熵损失函数;
步骤6:将训练样本数据输入到神经网络模型中进行迭代,然后更新神经网络的参数;
步骤7:将训练好的网络模型对待预测区域的化探数据进行矿化概率预测,生成该区域矿产资源的概率预测分布图。
2.根据权利要求1所述的一种基于样本失衡的深度学习矿产资源分类预测方法,其特征在于,所述步骤1中的地理位置信息包括已知矿靶区的经纬度坐标,地球化学元素信息包括已知矿靶区的各种地球化学元素的含量;在ArcGIS软件中输入地理位置信息和地球化学元素信息,经过基于地学统计的克里金插值法,最终得到已知矿靶区域的地质图像。
3.根据权利要求1所述的一种基于样本失衡的深度学习矿产资源分类预测方法,其特征在于,所述步骤2中利用ArcGIS软件对化探数据进行迭代自组织聚类,选取已知矿床区为聚类中心,将研究区域分为成矿远景区和背景区,成矿远景区占研究面积的A%,成矿远景区中包含已知矿床区;背景区占研究面积的(100-A)%,A为预设的占比。
4.根据权利要求1所述的一种基于样本失衡的深度学习矿产资源分类预测方法,其特征在于,所述步骤3包括如下步骤:
步骤31:将成矿远景区拆分为若干个正方形区域,每个区域的化探数据X从矩阵格式展开为n维向量[x1,x2,…,xn],xa∈(0,1),a=1,2,…,n,假定成矿远景区化探数据的各种属性特征满足隐藏空间的概率分布z;
步骤32:用神经网络构造一个编码器qΦ,Φ为训练参数,编码器以变分推断的方式产生i维的均值向量M=[μ1,μ2,...,μi]和i维的标准差向量N=[σ1,σ2,...,σi],由这两个向量可表示一个混合高斯分布qΦ(z|X)用于逼近隐藏空间的概率分布z;然后在分布qΦ(z|X)上随机采样,生成化探数据的隐含特征向量eps为满足均值为0方差为1的i维随机数向量;
步骤33:用神经网络构造一个解码器pθ,θ为训练参数,解码器的作用是用隐含特征向量γ生成数据并且使得尽可能的与X相似;
步骤34:为了使编码器qΦ所得的分布qΦ(z|X)逼近概率分布z和提高解码器pθ重构隐含特征向量γ为化探数据X的几率,构建损失函数
步骤35:使用成矿远景区的数据以最小化损失函数为目标训练编码器qΦ和解码器pθ;
步骤36:训练结束后,依次排查成矿远景区各区域的化探数据,若某个区域的重构交叉熵的值低于平均值,表示该区域的数据被重构的几率较小,空间数据特征也和周围区域相异,视为化探异常区域;
步骤37:将化探异常区与其距离最近的已知矿床区视为具有高度相似的空间数据特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210640643.7/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理