[发明专利]基于完全随机森林的矢量空间计算强度预测方法及系统有效
申请号: | 201711387102.3 | 申请日: | 2017-12-20 |
公开(公告)号: | CN108052755B | 公开(公告)日: | 2019-09-17 |
发明(设计)人: | 郭明强;黄颖;谢忠;关庆锋;吴亮;刘袁缘 | 申请(专利权)人: | 中国地质大学(武汉) |
主分类号: | G06F17/50 | 分类号: | G06F17/50;G06F16/56 |
代理公司: | 武汉知产时代知识产权代理有限公司 42238 | 代理人: | 冯必发 |
地址: | 430074 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 完全 随机 森林 矢量 空间 计算 强度 预测 方法 系统 | ||
1.一种基于完全随机森林的矢量空间计算强度预测方法,其特征在于,包括以下步骤:
S1、获取矢量空间计算强度原始样本集,每个矢量空间计算强度样本中均包括以下13个类型的数值:矢量图层包含的要素个数、要素几何类型、数据库类型、图层空间范围宽度、图层空间范围高度、空间计算域内要素个数、空间计算域内顶点数、窗口像素宽度、窗口像素高度、窗口地理宽度、窗口地理高度、容差半径、计算时间;使用二维数组RawSamples[i][j]存储矢量空间计算强度原始样本集,RawSamples[i][j]表示第i个样本第j个属性值;
S2、使用整型随机数生成器,生成N个大于等于0且小于N的整型数值,使用生成的N个整型数值,将其分别作为数组索引从原始样本集的各个样本中选取N个样本作为新的样本,将其存储到二维数组TreeSamples[i][j]中;其中,N为原始样本集中样本数量;
S3、采用回归决策树训练方法,利用步骤S2中得到的二维数组TreeSamples[i][j]进行训练,建立回归决策树;
S4、循环执行S2至S3,直到获得TN棵回归决策树,TN棵回归决策树构成了完全随机森林FRF;其中TN为完全随机森林中回归决策树的数量;
S5、获取待预测的矢量空间计算强度样本集,每个待预测的矢量空间计算强度样本包含以下12个类型的数值:矢量图层包含的要素个数、要素几何类型、数据库类型、图层空间范围宽度,图层空间范围高度、空间计算域内要素个数、空间计算域内顶点数、窗口像素宽度,窗口像素高度、窗口地理宽度、窗口地理高度、容差半径;使用一维数组NewSample存储待预测样本,NewSample[i]表示待预测样本的第i个属性值,将待预测的矢量空间计算强度样本输入到FRF中,调用FRF中的TN棵回归决策树的预测方法对待预测样本的计算时间进行预测,获得TN个预测结果,计算TN个预测结果的平均值AVG;
S6、分别计算TN棵回归决策树的预测结果与AVG之间的差值的绝对值,判断该差值的绝对值是否大于AVG*R,其中R是预先设定的百分比,如果回归决策树的预测结果与AVG之间的差值的绝对值大于AVG*R,则将其剔除,反之保留;
S7、计算S6中保留下来的回归决策树的预测结果的平均值FINALAVG,将平均值FINALAVG作为最终的计算强度预测结果。
2.一种基于完全随机森林的矢量空间计算强度预测系统,其特征在于,包括以下模块:
原始样本集处理模块,用于获取矢量空间计算强度原始样本集,每个矢量空间计算强度样本中均包括以下13个类型的数值:矢量图层包含的要素个数、要素几何类型、数据库类型、图层空间范围宽度、图层空间范围高度、空间计算域内要素个数、空间计算域内顶点数、窗口像素宽度、窗口像素高度、窗口地理宽度、窗口地理高度、容差半径、计算时间;使用二维数组RawSamples[i][j]存储矢量空间计算强度原始样本集,RawSamples[i][j]表示第i个样本第j个属性值;
整型数值生成模块,用于使用整型随机数生成器,生成N个大于等于0且小于N的整型数值,使用生成的N个整型数值,将其分别作为数组索引从原始样本集中获得N个样本作为新的样本,将其存储到二维数组TreeSamples[i][j]中;其中,N为原始样本集中样本数量;
决策树建立模块,用于采用回归决策树训练方法,利用整型数值生成模块中得到的二维数组TreeSamples[i][j]进行训练,建立回归决策树;
循环执行处理模块,用于循环调用整型数值生成模块与决策树建立模块,直到获得TN棵回归决策树,TN棵回归决策树构成了完全随机森林FRF;其中TN为完全随机森林中回归决策树的数量;
预测样本集处理模块,用于获取待预测的矢量空间计算强度样本集,每个待预测的矢量空间计算强度样本包含以下12个类型的数值:矢量图层包含的要素个数、要素几何类型、数据库类型、图层空间范围宽度,图层空间范围高度、空间计算域内要素个数、空间计算域内顶点数、窗口像素宽度,窗口像素高度、窗口地理宽度、窗口地理高度、容差半径;使用一维数组NewSample存储待预测样本,NewSample[i]表示待预测样本的第i个属性值,将待预测的矢量空间计算强度样本输入到FRF中,调用FRF中的TN棵回归决策树的预测方法对待预测样本的计算时间进行预测,获得TN个预测结果,计算TN个预测结果的平均值AVG;
预测结果处理模块,用于分别计算TN棵回归决策树的预测结果与AVG之间的差值的绝对值,判断该差值的绝对值是否大于AVG*R,其中R是预先设定的百分比,如果回归决策树的预测结果与AVG之间的差值的绝对值大于AVG*R,则将其剔除,反之保留;
最终结果获取模块,用于计算预测结果处理模块中保留下来的回归决策树的预测结果的平均值FINALAVG,将平均值FINALAVG作为最终的计算强度预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国地质大学(武汉),未经中国地质大学(武汉)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711387102.3/1.html,转载请声明来源钻瓜专利网。