[发明专利]基于随机森林的MR覆盖率影响因素判定方法在审
申请号: | 201810711159.2 | 申请日: | 2018-07-03 |
公开(公告)号: | CN109086964A | 公开(公告)日: | 2018-12-25 |
发明(设计)人: | 范山岗;田梦倩;陆怡琪;朱颖;熊健;杨洁;桂冠 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/30;G06N99/00 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 朱妃;董建林 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 维度 随机森林 覆盖率 影响因素 判定 清洗 测试样本 影响度 准确率 稳定性强 训练样本 输出 劣化 排序 抽取 清晰 | ||
本发明公开了一种基于随机森林的MR覆盖率影响因素判定方法,包括步骤:选取若干个影响MR覆盖率的相关维度;对维度数据进行清洗,得到清洗后的相关维度;抽取维度数据作为训练样本,剩余的维度数据作为测试样本;以清洗后的相关维度作为特征,根据训练样本来训练随机森林模型;将测试样本输入随机森林模型得到输出准确率;调整随机森林模型的参数,直至当输出准确率大于设定阈值,则将该随机森林模型作为MR覆盖率影响因素判定模型;计算每个影响MR覆盖率的相关维度的影响度;根据影响度,对若干个影响MR覆盖率的相关维度进行排序;利用MR覆盖率影响因素判定模型定位MR覆盖率的影响因素,清晰劣化根因。本方法精确度高,稳定性强。
技术领域
本发明涉及一种影响因素判定方法,特别是涉及一种基于随机森林的MR覆盖率影响因素判定方法,属于大数据处理和机器学习技术领域。
背景技术
MR覆盖率是移动通信网络运营管理中需要关注的一些重点KPI(Key PerformanceIndicators关键绩效指标),除了日常维护之外,运营商希望能够知道影响MR覆盖率的因素,获得MR覆盖率和网络之间的关联,方便后期网优任务分配及保障;所以需要从网络运行过程中挖掘出影响MR覆盖率的因素,即相关维度。
目前,计算MR覆盖率与各维度之间相关性的方法有很多种,但很多是计算两者之间的线性相关性,准确度不够;部分方法能够计算非线性相关性,但是其准确率无法判断,因此,在应用过程中,其有效性依然存在疑问。
发明内容
本发明的主要目的在于,克服现有技术中的不足,提供一种基于随机森林的MR覆盖率影响因素判定方法,实现准确、稳定地定位出主要的MR覆盖率的影响因素,清晰劣化根因。
为了达到上述目的,本发明所采用的技术方案是:
一种基于随机森林的MR覆盖率影响因素判定方法,包括以下步骤:
1)选取若干个影响MR覆盖率的相关维度;
2)对每个影响MR覆盖率的相关维度的维度数据进行清洗,形成相关维度数据集,并得到清洗后的相关维度;
3)从相关维度数据集中抽取维度数据作为训练样本,将相关维度数据集中剩余的维度数据作为测试样本;
4)以清洗后的相关维度作为特征,根据训练样本来训练随机森林模型;
5)将测试样本输入随机森林模型,得到输出准确率;
6)调整随机森林模型的参数,直至当输出准确率大于设定阈值,则将该输出准确率时的随机森林模型作为MR覆盖率影响因素判定模型;
7)计算每个影响MR覆盖率的相关维度的影响度;
8)根据计算所得的影响度,对若干个影响MR覆盖率的相关维度进行排序;
9)利用MR覆盖率影响因素判定模型定位MR覆盖率的影响因素,清晰劣化根因。
本发明进一步设置为:所述步骤1)中的若干个影响MR覆盖率的相关维度包括工作频段、载频数量、覆盖类型、经度、纬度、最大发射功率、弱覆盖采样点数、总采样点数、弱覆盖率采样点比例、中心载频的信道号、是否为上行干扰小区、是否为上行弱覆盖小区、是否过覆盖小区、站高、小区个体偏移量、频段指示、电子下倾角、机械下倾角、方位角、天线挂高和设备类型。
本发明进一步设置为:所述步骤2)中的对每个影响MR覆盖率的相关维度的维度数据进行清洗,包括维度数据整理和维度名称整理。
本发明进一步设置为:所述维度数据整理,具体为,
删除缺失值超过50%的维度;满足判定需求但存在缺失值的维度,将缺失值用平均值填充;由于机器故障或者人为操作造成的异于正常范围的数据为异常值,当检测出异常值后,将该异常值删除,再用平均值填充。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810711159.2/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理