[发明专利]文件解析方法和装置有效
申请号: | 201611208306.1 | 申请日: | 2016-12-23 |
公开(公告)号: | CN108241642B | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 王绪 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/22 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 韩建伟;张永明 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文件 解析 方法 装置 | ||
1.一种文件解析方法,其特征在于,包括:
获取存储有待解析文件的模板文件,所述模板文件中具有存储所述待解析文件的行含义或者列含义的预设存储单元;
从所述预设存储单元中获取所述待解析文件的行含义或者列含义;
根据获取的所述待解析文件的行含义或者列含义,对所述待解析文件进行解析;
其中,在获取存储有待解析文件的模板文件之前,所述方法还包括:获取所述待解析文件的数据存储格式;判断所述待解析文件的数据存储格式与所述模板文件是否相同;如果所述待解析文件的数据存储格式与所述模板文件不同,则在所述待解析文件中插入预设存储单元,并定义所述预设存储单元用于存储所述待解析文件的行含义或者列含义,以将所述待解析文件的数据存储格式转换为与所述模板文件相同;或者,将所述待解析文件导入所述模板文件,并在所述模板文件的预设存储单元中填写所述待解析文件的行含义或者列含义;
其中,在对所述待解析文件进行解析后,所述方法还包括:将解析后所得到的数据导入预设数据库;
其中,在将解析后所得到的数据导入预设数据库之前,所述方法还包括:接收数据处理指令,所述数据处理指令中包含数据处理方式及数据处理速度;按照所述数据处理指令中的数据处理方式及数据处理速度读取数据;将读取的数据赋值给预设数据结构,以通过所述预设数据结构将所述数据导入所述预设数据库。
2.根据权利要求1所述的方法,其特征在于:所述预设存储单元为列头或行头。
3.一种文件解析装置,其特征在于,包括:
获取模块,用于获取存储有待解析文件的模板文件,所述模板文件中具有存储所述待解析文件的行含义或者列含义的预设存储单元;
提取模块,用于从所述预设存储单元中获取所述待解析文件的行含义或者列含义;
解析模块,用于根据获取的所述待解析文件的行含义或者列含义,对所述待解析文件进行解析;
其中,所述装置还包括:数据获取模块,用于在获取存储有待解析文件的模板文件之前,获取所述待解析文件的数据存储格式;判断模块,用于判断所述待解析文件的数据存储格式与所述模板文件是否相同;配置模块,用于如果所述待解析文件的数据存储格式与所述模板文件不同,则在所述待解析文件中插入预设存储单元,并定义所述预设存储单元用于存储所述待解析文件的行含义或者列含义,以将所述待解析文件的数据存储格式转换为与所述模板文件相同;或者,导入模块,用于将所述待解析文件导入所述模板文件,并在所述模板文件的预设存储单元中填写所述待解析文件的行含义或者列含义;
其中,所述装置还包括:导入模块,用于在对所述待解析文件进行解析后,将解析后所得到的数据导入预设数据库;
其中,所述装置还包括:接收模块,用于在将解析后所得到的数据导入预设数据库之前,接收数据处理指令,所述数据处理指令中包含数据处理方式及数据处理速度;读取模块,用于按照所述数据处理指令中的数据处理方式及数据处理速度读取数据;赋值模块,用于将读取的数据赋值给预设数据结构,以通过所述预设数据结构将所述数据导入所述预设数据库。
4.根据权利要求3所述的装置,其特征在于:所述预设存储单元为列头或行头。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611208306.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种分布式数据库的操作方法
- 下一篇:关键词的指标数据分析方法及装置