[发明专利]一种分析网络访问日志的方法、系统、装置和存储介质在审
| 申请号: | 201911009697.8 | 申请日: | 2019-10-23 |
| 公开(公告)号: | CN110929107A | 公开(公告)日: | 2020-03-27 |
| 发明(设计)人: | 张毅;符伟彬 | 申请(专利权)人: | 广州艾媒数聚信息咨询股份有限公司 |
| 主分类号: | G06F16/903 | 分类号: | G06F16/903;G06F16/901 |
| 代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 黎扬鹏 |
| 地址: | 510006 广东省广州*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 分析 网络 访问 日志 方法 系统 装置 存储 介质 | ||
1.一种分析网络访问日志的方法,其特征在于,包括以下步骤:
获取日志记录中的url信息,根据url信息获取host字符串;
采用倒序查询的字典树对host字符串进行轮询匹配,根据匹配结果获取对应的应用信息。
2.根据权利要求1所述的一种分析网络访问日志的方法,其特征在于,所述获取日志记录中的url信息,根据url信息获取host字符串这一步骤,具体为:
通过运行MapReduce,以读取日志记录中的url信息,根据url信息获取host字符串。
3.根据权利要求1所述的一种分析网络访问日志的方法,其特征在于,所述采用倒序查询的字典树对host字符串进行匹配查询,根据匹配查询结果获取对应的应用信息这一步骤,具体包括以下步骤:
采用字典树从host字符串的尾部字母开始进行匹配查询;
根据预设的规则匹配配置文件识别到host字符串的标志后,从host字符串获得目的编号;
根据目的编号将host字符串发送至对应的匹配编号列表中进行轮询后,获得host字符串对应的应用信息。
4.根据权利要求3所述的一种分析网络访问日志的方法,其特征在于,所述字典树的数据结构包括子节点数组。
5.根据权利要求1所述的一种分析网络访问日志的方法,其特征在于,所述url信息还包括uri路径特征、请求参数特征和user-agent特征。
6.一种分析网络访问日志的系统,其特征在于,包括:
特征获取模块,用于获取日志记录中的url信息,根据url信息获取host字符串;
匹配查询模块,用于采用倒序查询的字典树对host字符串进行轮询匹配,根据匹配结果获取对应的应用信息。
7.根据权利要求6所述的一种分析网络访问日志的系统,其特征在于,所述特征获取模块具体用于通过运行MapReduce,以读取日志记录中的url信息,根据url信息获取host字符串。
8.根据权利要求6所述的一种分析网络访问日志的系统,其特征在于,所述匹配查询模块包括:
匹配查询单元,用于采用字典树从host字符串的尾部字母开始进行匹配查询;
标志识别单元,用于根据预设的规则匹配配置文件识别到host字符串的标志后,从host字符串获得目的编号;
编号轮询单元,用于根据目的编号将host字符串发送至对应的匹配编号列表中进行轮询后,获得host字符串对应的应用信息。
9.一种分析网络访问日志的装置,其特征在于,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现权利要求1-5任一项所述的一种分析网络访问日志的方法。
10.一种存储介质,其中存储有处理器可执行的指令,其特征在于,所述处理器可执行的指令在由处理器执行时用于执行如权利要求1-5任一项所述方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州艾媒数聚信息咨询股份有限公司,未经广州艾媒数聚信息咨询股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911009697.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种塑料薄膜包覆设备
- 下一篇:基于UVC协议的人脸识别方法及装置





