[发明专利]基于mbx格式的邮件正文的获取方法及系统有效
申请号: | 201310521274.0 | 申请日: | 2013-10-28 |
公开(公告)号: | CN103559244A | 公开(公告)日: | 2014-02-05 |
发明(设计)人: | 吴子章;刘申 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京鸿元知识产权代理有限公司 11327 | 代理人: | 陈英俊 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 mbx 格式 邮件 正文 获取 方法 系统 | ||
1.一种基于mbx格式的邮件正文的获取方法,包括:
将mbx格式的邮件批量映射到内存;
将批量映射到内存的所述mbx格式的邮件的首行转换成模式串,并将所述模式串的前六个字节作为模式子串,在批量映射到内存的所述mbx格式的邮件除首行之外的其余行的首部位置添加标志;将每行所述标志后的六个字节形成数据块映射到缓存上,然后对所述数据块进行分组,筛选出每组数据块中的所述模式子串,并记录所述模式子串的位置;并且,通过查找每行首部位置的所述标志确定并记录空行的位置;
通过匹配所述空行的位置和所述模式子串的位置确定邮件正文的位置;
根据所确定的邮件正文的位置获取所述邮件正文。
2.如权利要求1所述的基于mbx格式的邮件正文的获取方法,其中,在筛选每组数据块中的所述模式子串的过程中,
将所述模式子串分成字母模式串和符号模式串,分别进行hash值的计算;
对所述字母模式串和所述符号模式串依次向左偏移八字节计算hash值,分别存储在字母模式串和符号模式串的hash表中,公式如下:
其中,char At(i)表示模式子串的第i个元素的ASCII码值;
查询字母模式串的hash表和查询所述符号模式串的hash表;其中,
如果所述字母模式串未偏移计算出的hash值与所述字母模式串向左偏移八字节计算出的hash值相等,并且所述符号模式串未偏移计算出的hash值与所述符号模式串向左偏移八字节计算出的hash值相等,则模式子串匹配成功;
筛选出匹配成功的模式子串。
3.如权利要求1所述的基于mbx格式的邮件正文的获取方法,其中,在对数据块进行分组的过程中,
第一组的行数为预设行数,其余行数为平均邮件头的长度。
4.如权利要求1所述的基于mbx格式的邮件正文的获取方法,其中,在通过查找每行首部位置的所述标志确定空行的位置的过程中,
如果在所述标志后查找到换行符,则将与所述换行符所在的行确定为空行。
5.一种基于mbx格式的邮件正文的获取系统,包括:
邮件映射单元,用于将mbx格式的邮件批量映射到内存;
模式串转换单元,用于将批量映射到内存的所述mbx格式的邮件的首行转换成模式串;
模式子串生成单元,用于将所述模式串的前六个字节作为模式子串;
标志添加单元,用于在批量映射到内存的所述mbx格式的邮件除首行之外的其余行的首部位置添加标志;
数据块映射单元,用于将每行所述标志后的六个字节形成数据块映射到缓存上;
数据块分组单元,用于对映射到缓存上的所述数据块进行分组;
模式子串筛选单元,用于筛选出每组数据块中的所述模式子串;
模式子串记录单元,用于记录筛选出的所述模式子串的位置;
空行位置确定单元,用于通过查找所述标志确定空行的位置;
空行位置记录单元,用于记录确定出的空行的位置;
邮件正文确定单元,用于通过匹配所述空行的位置和所述模式子串的位置确定邮件正文的位置;
邮件正文获取单元,用于根据所确定的邮件正文的位置获取所述邮件正文。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310521274.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据业务处理方法及装置
- 下一篇:一种可移动法兰端面加工机械