[发明专利]基于二进制编码的DNS数据压缩、解压缩方法及系统有效
| 申请号: | 201210333176.X | 申请日: | 2012-09-07 |
| 公开(公告)号: | CN103685589B | 公开(公告)日: | 2017-01-25 |
| 发明(设计)人: | 阳任科 | 申请(专利权)人: | 中国科学院计算机网络信息中心 |
| 主分类号: | H04L29/12 | 分类号: | H04L29/12;H04L29/06;G06F17/30 |
| 代理公司: | 北京君尚知识产权代理事务所(普通合伙)11200 | 代理人: | 余长江 |
| 地址: | 100190 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 二进制 编码 dns 数据压缩 解压缩 方法 系统 | ||
1.一种基于二进制编码的DNS数据压缩方法,其步骤为:
1)数据读取模块从DNS数据源文件中读取日志信息后,将数据打包放到一缓存队列中;
2)数据压缩模块从该数据缓存队列中取出数据并压缩后,将其存储到一压缩信息缓存中;
3)二进制编码模块从该压缩信息缓存中取出数据并进行二进制编码后保存到一结果文件中。
2.如权利要求1所述的方法,其特征在于采用可变长度整型编码规则进行所述二进制编码;所述可变长度整型编码的最大长度为128字节。
3.如权利要求2所述的方法,其特征在于二进制编码后的每个数据域包括标志字段和数据字段两部分;其中,标志字段用于指明数据的类型和数据在消息结构体中的序号,数据字段用于存储数据的值;一个DNS数据包二进制编码后对应一个消息结构体。
4.如权利要求1所述的方法,其特征在于所述数据压缩模块对日志信息中的时间数据信息进行压缩,其方法为:首先从所述缓存队列中读取一条记录,如果是首条记录则保留该记录完整的时间格式;否则判断当前记录的在设定级时间域及其上级时间域的时间与上一条记录的对应级时间域是否相等,如果相等,则只保留设定级时间域下一级时间的时间;如果不相等,则判断当前记录时间与上一记录时间间隔是否大于设定阈值,如果大于该阈值,则保留当前记录完整的时间格式,否则比较设定级时间域下一级时间的时间,如果当前记录设定级时间域下一级时间小于上一条记录对应时间,则只保留当前记录设定级时间域的下一级时间域的时间,否则保留当前记录完整的时间格式。
5.如权利要求1所述的方法,其特征在于所述数据压缩模块对日志信息中的域名数据和IP数据信息进行压缩;a)对于域名数据进行压缩的方法为:从所述缓存队列中读取一条记录,在所述哈希链表中搜索该记录中的域名;如果存在该域名,则将该域名在哈希链表中的哈希位置保存到所述结果文件中,如果不存在该域名,则在所述哈希链表中为该域名构建结点并将该域名保存到所述结果文件中;b)对于IP地址数据信息进行压缩的方法为:从所述缓存队列中读取一条记录,在所述哈希链表中搜索该记录中的IP地址;如果存在该IP,则将该IP在哈希链表中的哈希位置保存到所述结果文件中,如果不存在该IP,则在所述哈希链表中为该IP构建结点并将该IP保存到所述结果文件中。
6.一种基于二进制编码的DNS数据压缩文件的解压缩方法,其步骤为:
1)二进制解码模块将结果文件中二进制编码压缩日志信息进行二进制编码解压后,保存到压缩信息缓存中;
2)数据解压模块从压缩信息缓存中取出数据,将其存储到一解压信息缓存中;
3)数据解压模块从该解压信息缓存中取出数据并进行解压得到日志记录信息。
7.如权利要求6所述的方法,其特征在于所述数据解压模块从该解压信息缓存中取出数据,对时间数据进行解压,其方法为:首先从所述解压信息缓存中读取一条记录,如果是完整的时间格式,则将其设为基准时间;否则判断当前记录的时间域的时间是否大于或等于上一条记录的对应时间域的时间,如果是,则利用上一条记录的完整格式时间和当前记录的时间域的时间合成当前记录的完整时间格式;如果小于,则利用上一条记录的完整格式时间将当前记录的时间域的上一级时间域加1并判断上一级时间域是否需要进制,如需要进制则利用上一条记录的完整格式时间进行调整并继续逐级判断是否需要进制,合成当前记录的完整时间格式;如果不需要进制,则利用上一条记录的完整格式时间和当前记录的时间域的时间合成当前记录的完整时间格式;其中,所述时间域为微秒时间域。
8.如权利要求6所述的方法,其特征在于所述数据解压模块从该解压信息缓存中取出数据,对域名数据和IP数据进行解压;a)对于域名数据,其解压方法为:从所述解压信息缓存中读取一条记录,如果域名为完整格式,则将其加入到哈希链表中并返回;如果域名信息为所述哈希链表中的位置信息,则根据该位置信息从所述哈希链表相应位置处读出域名的完整格式,并返回;b)对于IP数据,其解压方法为:从所述解压信息缓存中读取一条记录,如果IP为完整格式,则将其加入到哈希链表中并返回;如果IP信息为所述哈希链表中的位置信息,则根据该位置信息从所述哈希链表相应位置处读出IP的完整格式,并返回。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算机网络信息中心,未经中国科学院计算机网络信息中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210333176.X/1.html,转载请声明来源钻瓜专利网。





