[发明专利]一种基于随机森林的指标关联强度排序方法在审
申请号: | 201911044792.1 | 申请日: | 2019-10-30 |
公开(公告)号: | CN110929990A | 公开(公告)日: | 2020-03-27 |
发明(设计)人: | 桂冠;张凯旋;曾骏;樊广辉 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/30 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林 |
地址: | 210012 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 随机 森林 指标 关联 强度 排序 方法 | ||
1.一种基于随机森林的指标关联强度排序方法,其特征在于:包括以下步骤:
步骤a,采集同一批小区的同一时间无线感知关键质量KQI指标数据与无线感知性能KPI指标数据;
步骤b,将KQI指标数据与能KPI指标数据合并,创建同一批小区的同一时间KQI指标与KPI指标数据表;
步骤c,对KPI指标进行相关性分析以及方差统计分析,去除冗余特征;
步骤d,根据KQI指标的变差门限将KQI指标划分为两个区间,分别为质差区间和质优区间;
步骤e,将质差区间标1,质优区间标0,得到一份有标签的KPI指标数据;
步骤f,用有标签的KPI指标数据训练随机森林,输出各指标在随机森林中的重要性排序。
2.根据权利要求1所述的一种基于随机森林的指标关联强度排序方法,其特征在于:步骤a中,ECI被用于唯一标识一个小区。
3.根据权利要求1所述的一种基于随机森林的指标关联强度排序方法,其特征在于:步骤a中,KQI指标数据包括页面显示时延、视频播放平均等待时延、即时通信响应时延和游戏响应时延;KPI指标数据包括下行PRB平均利用率,RRC连接平均数和小区用户面上行丢包率。
4.根据权利要求1所述的一种基于随机森林的指标关联强度排序方法,其特征在于:步骤b中,KQI指标数据连接到KPI指标数据之后。
5.根据权利要求1所述的一种基于随机森林的指标关联强度排序方法,其特征在于:步骤c中,KPI指标相关性分析方法采用皮尔森相关系数法,分析各指标间的线性相关性,在线性相关性高的指标中选择一个保留。
6.根据权利要求1所述的一种基于随机森林的指标关联强度排序方法,其特征在于:步骤c中,KPI指标方差统计分析方法具体为对每个KPI指标进行方差统计,对于方差较小的指标,反映在数据上即为数据区分度小的指标删去。
7.根据权利要求5所述的一种基于随机森林的指标关联强度排序方法,其特征在于:皮尔森相关系数法包括,两两之间计算两个变量的协方差和标准差,两者作商得到结果。
8.根据权利要求1所述的一种基于随机森林的指标关联强度排序方法,其特征在于:步骤d中,划分KQI指标的变差门限具体为,页面显示时延变差门限为3000ms,视频播放平均等待时延为6500ms,即时通信响应时延为300ms,游戏响应时延为300ms,超过变差门限即为质差区间,低于变差门限即为质优区间。
9.根据权利要求1所述的一种基于随机森林的指标关联强度排序方法,其特征在于:步骤f包括以下具体步骤,
S01,输入带标签的KPI指标数据,训练出一个随机森林分类器;
S02,计算随机森林中各节点的基尼指数,并计算得到分枝后两个新节点的基尼指数,基尼指数GI计算公式如下:
其中,K表示有K个类,pk表示样本点属于第k类的概率;
S03,计算节点前后基尼指数的变化量,得到该节点特征的重要性评分,公式如下:
其中,表示第j个特征在节点m的基尼指数评分,GIm表示节点m的基尼指数,GIl和GIr表示分枝后的两个新节点的基尼指数;
S04,对所有求得的重要性评分做一个归一化处理得到各指标关联强度排序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911044792.1/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理