[发明专利]一种网吧客户机IP范围识别方法有效
| 申请号: | 201811122944.0 | 申请日: | 2018-09-26 |
| 公开(公告)号: | CN109327556B | 公开(公告)日: | 2021-06-01 |
| 发明(设计)人: | 赵丽丽;祝小斌 | 申请(专利权)人: | 武汉文网亿联科技有限公司 |
| 主分类号: | H04L29/12 | 分类号: | H04L29/12 |
| 代理公司: | 武汉汇知云专利代理事务所(普通合伙) 42283 | 代理人: | 张熔舟 |
| 地址: | 430000 湖北省武汉市东湖新技术开发区*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 网吧 客户机 ip 范围 识别 方法 | ||
1.一种网吧客户机IP范围识别方法,其特征在于,包括以下步骤:
(1)数据采集:有两种数据采集方式,其中,第一种数据采集是通过路由器每隔半小时监控网吧在线IP地址、mac地址和是否安装客户端;第二种数据采集是网吧中安装了客户端的电脑,每次开机关机都会通过客户端上传上网人员信息、客户机IP信息,数据采集次数不固定,且为累计数据;
(2)获取全部IP和安装客户端IP:通过步骤(1)中的两种数据采集方式获得数据后合并得到网吧的全部IP,并从网吧全部IP中去识别客户机IP范围;将两种数据中安装客户端的IP进行合并,得到网吧全部安装客户端的IP;
(3)识别客户机IP的规则:筛选出MAC地址对应出现的且MAC地址被采集比例≤β的MAC地址,则MAC地址对应的IP地址即为客户机IP,其中和β为待确定的参数;
(4)需断网的客户机IP范围的识别
根据步骤(3)的客户机IP规则识别出客户机IP,进而识别出需断网的客户机IP范围,包括下述子步骤:
(4-1)确定样本:选择湖北省、湖南省、广东省、四川省中受文网卫士监管且客户端安装率为100%的所有网吧在某一时间段的第一种采集数据和第二种采集数据作为样本;
(4-2)确定网吧全部IP和真实客户机IP:采用步骤(2)的方法获取网吧全部IP和全部安装客户端的IP,而安装率100%的网吧,即每台客户机都安装客户端,全部安装客户端的IP即为客户机IP的全量范围,即网吧的真实客户机IP;
(4-3)提取变量:使用步骤(1)中的第一种采集数据,能每隔半小时获取网吧在线mac地址和ip地址,统计出样本中每个网吧每个mac地址对应的IP数以及Mac地址被采集的次数;
(4-4)预测客户机IP:根据(4-3)中提取的变量,筛选出MAC地址对应出现的且MAC地址被采集比例≤β的MAC地址,将其对应的IP地址当做预测的客户机IP;其中,取值范围大于等于1,β取值范围在0-1之间;
(4-5)确定客户机IP范围:剔除预测的客户机IP中不属于连续区间范围内的离群IP值,对步骤(4-4)中使用和β参数得到的客户机IP进行分段,根据取值比较连续的IP分成一段,IP间隔较大的进行分段的原则,确定分段间隔gap1和段内数量gap2,得到不同的IP段并确定划分的段是否为非离群的个体或区间,也即只有达到一定样本量的区间才被当做客户机IP范围;
(4-6)预测正确率:将根据步骤(4-1)至(4-5)后所得的预测的客户机IP范围与真实客户机IP使用第一正确率和第二错误率来衡量最终的正确率;
其中,第一种正确率:真实客户机IP中被预测为客户机IP的比例=真实客户机中落入预测的客户机IP范围中的IP数/真实客户机中IP总数;
第二种错误率:预测的客户机IP中非真实客户机IP的比例=预测的客户机IP在预测的客户机IP范围中但不在真实客户机IP中的IP总数/预测的客户机IP在预测的客户机IP范围中的总数;
(4-7)调参:根据(4-6)中的公式计算所有网吧所有网段的第一种正确率的均值和第二种错误率的均值,去衡量整体预测效果;其中,第一个正确率越高、第二个错误率越低表明预测效果越好;
(5)根据步骤(4-1)至(4-7)循环设置β、gap1和gap2的参数,并从整体预测效果最佳的角度确定β、gap1和gap2的取值,确定四个参数后,使用和β参数筛选MAC地址对应出现的且MAC地址被采集比例≤β的MAC地址,其对应的IP地址即为预测的客户机IP,然后将预测的客户机IP由小到大排序,将相邻间隔超过gap1的进行分段,将IP数量超过gap2的段当做客户机IP范围。
2.根据权利要求1所述的一种网吧客户机IP范围识别方法,其特征在于,第一种采集方式的具体方法为:路由器通过UDP广播包通知客户端,客户端收到广播包后回应约定的消息给路由器,路由器根据客户端的回应来判断是否安装,并将网吧在线Mac地址、IP地址和是否安装客户端的标识变量上传到Hadoop平台,一天共采集网吧48次数据。
3.根据权利要求1所述的一种网吧客户机IP范围识别方法,其特征在于,所述MAC地址被采集比例为在第一种数据采集中MAC地址被采集的次数与固定采集次数的比值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉文网亿联科技有限公司,未经武汉文网亿联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811122944.0/1.html,转载请声明来源钻瓜专利网。





