[发明专利]基于半监督随机森林模型的区域滑坡易发性预测方法在审
| 申请号: | 202110168854.0 | 申请日: | 2021-02-07 |
| 公开(公告)号: | CN112966722A | 公开(公告)日: | 2021-06-15 |
| 发明(设计)人: | 黄发明;潘李含;李文彬;陶思玉 | 申请(专利权)人: | 南昌大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00;G06Q10/04 |
| 代理公司: | 南昌青远专利代理事务所(普通合伙) 36123 | 代理人: | 刘爱芳 |
| 地址: | 330000 江西省南*** | 国省代码: | 江西;36 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 监督 随机 森林 模型 区域 滑坡 易发性 预测 方法 | ||
1.一种基于半监督随机森林模型的区域滑坡易发性预测方法,其特征在于,包括以下步骤:
S1:通过RS和ArcGIS平台管理并空间分析研究区内的滑坡编录及相关控制因素筛选出已知滑坡样本,所述控制因素为地形地貌、基础地质、水文环境、地表覆被四大类;
S2:基于频率比和相关性分析,确定最能表征滑坡发育特征的控制因素,频率比标记为FR,建立随机森林模型:
在ArcGIS软件中将已知的滑坡编录的面文件转为栅格单元,同时在研究区的非滑坡区中随机选择等比例的非滑坡栅格单元组成模型的训练测试数据集,并进一步将其随机划分为两个部分:70%的数据集用于训练,剩下的30%用于测试;在随机森林模型训练测试过程中,将正样本已知的滑坡栅格单元用1表示,将负样本随机选择的非滑坡栅格单元用0表示;随机森林模型的输出变量是各栅格单元位于0~1之间的概率值,且这些0~1概率值分布即反映了区域滑坡易发性的分布规律;用训练测试好的随机森林模型预测得到的整个研究区的初始滑坡易发性值,然后采用ArcGIS软件中中自然间断点分级法并结合滑坡易发性分布规律将研究区划分为5类滑坡易发性级别:1-极低易发区、2-低易发区、3-中等易发区、4-高易发区和5-极高易发区;
S3:基于控制因素的FR值、已知滑坡栅格单元和随机选择的非滑坡栅格单元,对全监督机器学习即随机森林模型,根据步骤S2中的五类滑坡易发性等级进行输出预测出初始滑坡易发性值;
S4:将高分辨率遥感影像与初始滑坡易发性图相叠加,从初始极高滑坡易发区中通过利用影像上滑坡体的形状、尺寸、色调及结构特征与野外勘察结果建立的遥感解译标志在ArcGIS中圈出发生滑坡概率极高的区域,然后随机在该区域选择栅格单元作为“潜在滑坡”,用来扩充已知滑坡样本;经扩充后的滑坡样本,和步骤S1中的已知滑坡样本,共同构成滑坡样本;
S5:从1-极低易发区中随机选取栅格单元作为非滑坡样本;
S6:建立半监督随机森林模型:在步骤S4和S5的基础上得到扩充后的滑坡样本和准确选取的非滑坡样本,再次导入随机森林模型中进行训练测试,即构建成功了半监督随机森林模型并进行最终的滑坡易发性预测,具体步骤为:
S61:自所述步骤S21得到的初始滑坡易发性值导入ArcGIS软件中生成初始滑坡易发性图,进一步利用自然间断点分级法得到研究区的5-极高易发区;再利用影像上滑坡体的形状、尺寸、色调及结构特征与野外勘察结果;分析来建立区域滑坡遥感解译标志;最后根据滑坡遥感解译标志解译出5-极高易发区内的滑坡隐患点;得到扩充后的滑坡样本标记为1和准确选取的非滑坡样本标记为0;最后同样将扩充后的滑坡和非滑坡栅格数据随机划分为训练(70%)和测试样本(30%),以便再次用于随机森林模型的训练和测试等建模过程。
S62:将第二次训练测试好的半监督随机森林模型用于研究区的滑坡易发性预测,为了方便模型对比,半监督随机森林模型也将预测的滑坡易发性值导入ArcGIS软件按自然间断点分级法分为5个等级,1-极低易发区、2-低易发区、3-中等易发区、4-高易发区和5-极高易发区。
2.根据权利要求1所述的一种基于半监督随机森林模型的区域滑坡易发性预测方法,其特征在于,所述的步骤S1是根据研究区的基础地质资料,基于ArcGIS平台与遥感影像目视解译来获取研究区的地形地貌、水文环境、地层岩性和地表覆被四大类控制因素。
3.根据权利要求1所述的一种基于半监督随机森林模型的区域滑坡易发性预测方法,其特征在于,所述的步骤S2的频率比法是一种高效的定量分析法,频率比值计算公式为:
FR1表明控制因素某个区间内的属性有利于滑坡发育,而FR1表示控制因素某个区间内的属性不利于滑坡发育。
4.根据权利要求1所述的一种基于半监督随机森林模型的区域滑坡易发性预测方法,其特征在于,所述的步骤S2是在SPSS23软件中通过相关性分析计算各控制因素间的相关系数,在SPSS23软件中选择Pearson相关系数并检验显著性相关。首先看显著性,若小于0.05,则表示不同两个控制因素之间有线性关系;然后看相关系数,若相关系数的绝对值大于0.8是极强相关,0.6-0.8是强相关,0.4-0.6是中等程度相关,0.2-0.4是弱相关,小于0.2是不相关;若结果表明各控制因素间相关性不大,即均可用作模型的输入变量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南昌大学,未经南昌大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110168854.0/1.html,转载请声明来源钻瓜专利网。





