[发明专利]一种HTTP协议还原中两个会话数据合并的方法有效
申请号: | 201210026647.2 | 申请日: | 2012-02-07 |
公开(公告)号: | CN102594880A | 公开(公告)日: | 2012-07-18 |
发明(设计)人: | 魏伟光 | 申请(专利权)人: | 北京锐安科技有限公司 |
主分类号: | H04L29/08 | 分类号: | H04L29/08 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 余功勋 |
地址: | 100044 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 http 协议 还原 两个 会话 数据 合并 方法 | ||
技术领域
本发明属于数据通信领域,涉及一种HTTP协议还原中两个会话数据合并的方法。
背景技术
基于HTTP协议的WEB应用种类繁多,包括BBS、BLOG、CHAT等。将其内容进行解析还原,对当今网络安全有重大意义。
传统WEB应用协议还原方法针对每个HTTP数据包,从中取出登录信息、邮件内容等感兴趣的信息,数据包之间没有联系。而对于网页邮件、论坛之类的协议,通常支持附件上传。上传的附件与发表的正文位于两个不同的HTTP数据包中。使用传统的WEB类协议还原方法,可以分别提取两个数据包中的信息,但无法体现出二者之间的关系,不能满足更高的协议还原要求。
发明内容
针对上述传统WEB类协议还原的局限性,本发明提出了一种数据合并的方法,用于将附件信息与正文、登录等信息关联起来。
本发明针对传统WEB类协议还原不能将附件与正文关联起来的局限性,提出了一种HTTP协议还原中两个会话数据合并的方法,实现了数据的合并。
本发明的主要技术内容为:
1)根据绝大多数情况,假定传送附件的数据包(此文档中命名为附件数据包)总是在传送正文的数据包(此文档中命名为正文数据包)之前;
2)对于每个被协议还原设备从登录数据包中截获到的用户登陆信息,将其加入到一个哈希表中(此文档中命名为登录信息表),如果没有截获到登录信息,则使用附件数据包或正文数据包中提取的用户信息作为一条登录信息,然后将其加入到哈希表中;
3)登录信息表中每一项包含一个预先设置的指针,用于存储事先到达的附件信息,附件信息中包含附件的个数、每个附件的名称以及具体的文件内容;
4)若有多个附件,则后续附件数据包处理中需要查找登录信息表中对应的指针是否为空,若为空,则将本次附件数据包处理中获取的附件信息(包括文件名、文件长度、文件内容)做为一个整体结构保存到一个队列中,并将队列首地址存储到登录信息表中对应的指针中;若不为空,则需要在已有的队列中增加新的附件信息索引项;
5)正文数据包到来时,需要查询对应的登录信息表,若用于存储附件信息的指针不为空,则将此正文数据与指针指向的附件数据合并起来。具体做法是:生成一个新的结构,其中包含源IP、目的IP、URL、账号、标题、正文内容、附件个数、附件名称、附件内容,并使用从本次正文数据包中解析出的正文信息内容以及在登录信息表中查询到的附件信息的内容来填充这一结构,用于输出;
6)将合并后的数据按照事先在输出接口中约定的格式输出一条结构化信息,包含源IP、目的IP、URL、账号、标题、正文内容、附件个数、附件名称,并输出一个包含附件内容的压缩包,结构化信息文件与压缩包存储在本地磁盘/data目录下。
所述步骤1)适合绝大多数WEB类应用,如网页邮件、网页论坛、博客、微博等,因此可以做这样的合理假设。
所述步骤2)是将登录信息组织为一个哈希表,以方便管理和查询。对于没有截获到登录信息的数据,可以使用附件数据包本身包含的用户信息生成对应的登录信息。
所述步骤3)是数据合并的关键,在登录信息中维护着指向预先到达的附件数据的指针,步骤5)中使用该指针来完成数据的合并。
所述步骤4)针对多个附件的情况,如果是第一个附件,那么登录信息中的指针应为空,此时将解析出的附件信息存储到一个队列中,并将队列首地址存储到这个指针上;如果不是第一个,那么需要将解析出的附件信息添加到早先的附件信息队列中。
所述步骤5)解析出已经到达的正文信息,根据正文信息中包含的账号(正文中本身包含,或采取用户ID关联的方法从协议还原设备已经解析到的登录信息中获取)查找到对应的登录信息表项后,取下附件内容(若无,则忽略),与解析出的正文内容合并。
所述步骤6)将已经合并的数据按照事先约定的文件格式输出到本地磁盘,等待入数据库。
步骤3)中所述登录信息表如图1所示,在哈希表Table中利用用户IP地址和端口形成的哈希值来索引该表,找到对应的Att_ptr,即存储附件信息的指针。指针可关联多个附件,均存储在Att_ptr指向的ATT表(存储附件信息表)中。
整个合并的流程如图2所示。同时,将哈希表项置于超时链表中,在规定的时间到达后,丢弃表中超时的项。这样可以防止内存过度占用,避免存储浪费,这一点针对只有附件,没有正文的数据非常有效。
与现有技术相比,本发明的优点与积极效果
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京锐安科技有限公司,未经北京锐安科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210026647.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:呼吸补助设备
- 下一篇:一种防倒退螺纹连接器