[发明专利]一种生成网吧IP数据库的方法及装置有效
申请号: | 201210367803.1 | 申请日: | 2012-09-28 |
公开(公告)号: | CN103699546A | 公开(公告)日: | 2014-04-02 |
发明(设计)人: | 欧阳佑;吴明辉 | 申请(专利权)人: | 北京思博途信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 栗若木;曲鹏 |
地址: | 100012 北京市朝阳区北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 生成 网吧 ip 数据库 方法 装置 | ||
1.一种生成网吧IP数据库的方法,包括:
从服务器的网络行为日志中提取Cookie,在全部行为日志时间范围内,记录该Cookie每次访问互联网所使用的IP地址及相应的访问时间;
根据所述Cookie每次访问互联网所使用的IP地址及相应的访问时间,在全部行为日志时间范围内分别统计各IP地址的网吧IP特征;
对于各IP地址,分别根据该IP地址的网吧IP特征是否满足预设的判决策略来判断该IP地址是否为网吧IP地址,如果满足预设的判决策略则判断该IP地址为网吧IP地址,并将所有判断为网吧IP地址的IP地址生成网吧IP数据库。
2.如权利要求1所述的方法,其特征在于:
所述IP地址的网吧IP特征,包括以下一个或多个:
曾经使用过该IP地址的每个Cookie的存活时间;其中,每个Cookie的存活时间为每个Cookie在全部行为日志数据中第一次和最后一次访问互联网的时间间隔;
曾经使用过该IP地址的每个Cookie在全部行为日志数据中曾经使用过的不同的IP地址的个数;
曾经使用过该IP地址的每个Cookie在全部行为日志数据中使用此IP地址访问互联网的次数占此Cookie访问互联网的总次数的比例;
在所述全部行为日志时间范围内,所有曾经使用过该IP地址的Cookie在每天每一小时内访问互联网的次数占所有Cookie访问互联网的次数的比例;
在所述全部行为日志时间范围内,所有曾经使用过该IP地址的Cookie第一次和最后一次访问互联网的时间间隔。
3.如权利要求2所述的方法,其特征在于:
所述根据该IP地址的网吧IP特征是否满足预设的判决策略来判断该IP地址是否为网吧IP地址的步骤包括以下一种或多种情况:
如果曾经使用过该IP地址的所有Cookie中,存活时间在24小时之内的Cookie总数占所有Cookie的比例大于第一预设阈值,则判断该IP地址是网吧IP地址;
如果曾经使用过该IP地址的所有Cookie中,使用过不同的IP地址为预设个数的Cookie总数占所有Cookie的比例大于第二预设阈值,则判断该IP地址是网吧IP地址;
如果曾经使用过该IP地址的所有Cookie中,使用此IP地址访问互联网的次数占访问互联网的总次数的比例超过50%的Cookie的总数占所有Cookie的比例大于第三预设阈值,则判断该IP地址是网吧IP地址;
如果曾经使用过该IP地址的所有Cookie在所述全部行为日志时间范围内从凌晨1点到7点访问互联网的比例大于第四预设阈值,则判断该IP地址是网吧IP地址;
如果曾经使用过该IP地址的所有Cookie第一次和最后一次访问互联网的时间间隔占全部行为日志时间范围的比例大于第五预设阈值,则判断该IP地址是网吧IP地址;
如果该IP地址为机器学习得到的IP分类模型中的正类IP地址,则判断该IP地址是网吧IP地址;
其中,所有Cookie是指在所述全部行为日志时间范围内曾经使用过此IP地址的所有的Cookie。
4.如权利要求3所述的方法,其特征在于:
所述机器学习得到的IP分类模型中的正类IP地址是指:根据所述IP地址的网吧IP特征应用机器学习法从真实的网吧IP地址中训练出的IP分类模型中的IP地址分类。
5.如权利要求1~4任一项权利要求所述的方法,其特征在于:所述方法还包括:
每隔一段固定的时间,重新在所述全部行为日志时间范围内提取Cookie,按照如权利要求1所述的方法重新生成新的网吧IP数据库。
6.一种生成网吧IP数据库的装置,包括:
Cookie网络行为信息获取模块,用于从服务器的网络行为日志中提取Cookie,在全部行为日志时间范围内,记录该Cookie每次访问互联网所使用的IP地址及相应的访问时间;
IP地址特征统计模块,用于根据所述Cookie每次访问互联网所使用的IP地址及相应的访问时间,在全部行为日志时间范围内分别统计各IP地址的网吧IP特征;
网吧IP数据库生成模块,用于对于各IP地址,分别根据该IP地址的网吧IP特征是否满足预设的判决策略来判断该IP地址是否为网吧IP地址,如果满足预设的判决策略则判断该IP地址为网吧IP地址,并将所有判断为网吧IP地址的IP地址生成网吧IP数据库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京思博途信息技术有限公司,未经北京思博途信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210367803.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种射频测试屏蔽箱
- 下一篇:反应器三重安全防爆装置