[发明专利]文件解析方法和装置有效
申请号: | 201611208306.1 | 申请日: | 2016-12-23 |
公开(公告)号: | CN108241642B | 公开(公告)日: | 2021-03-30 |
发明(设计)人: | 王绪 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/22 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 韩建伟;张永明 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文件 解析 方法 装置 | ||
本发明公开了一种文件解析方法和装置。其中,该方法包括:获取存储有待解析文件的模板文件,模板文件中具有存储待解析文件的行含义或者列含义的预设存储单元;从预设存储单元中获取待解析文件的行含义或者列含义;根据获取的待解析文件的行含义或者列含义,对待解析文件进行解析。本发明解决了由于相关技术中通过索引来解析对应列的数据对使用人员要求高,易于出错的技术问题。
技术领域
本发明涉及数据处理技术领域,具体而言,涉及一种文件解析方法和装置。
背景技术
随着互联网技术的进步,特别是针对不同客户对网络服务的需求,产生了各种服务互联网需求的应用技术,其中,相关技术中通过使用逗号分隔型取值格式(CommaSeparated Values,简称CSV)文件实现与媒体端之间的信息传输。
在使用相关技术时,现在解析CSV文件是通过索引来解析对应列的数据,这样使用人员必须记住每个列所代表的具体含义,如果记错误了就会导致上传的数据出错或者直接上传失败,进而导致解析结果出错。如果有需求变化,需要在指定的地方添加新的列,那么原来按照列解析的顺序就需要全部修改,不利于开发人员对于代码的维护。
针对上述由于相关技术中通过索引来解析对应列的数据对使用人员要求高,易于出错的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种文件解析方法和装置,以至少解决由于相关技术中通过索引来解析对应列的数据对使用人员要求高,易于出错的技术问题。
根据本发明实施例的一个方面,提供了一种文件解析方法,包括:获取存储有待解析文件的模板文件,模板文件中具有存储待解析文件的行含义或者列含义的预设存储单元;从预设存储单元中获取待解析文件的行含义或者列含义;根据获取的待解析文件的行含义或者列含义,对待解析文件进行解析。
可选的,预设存储单元为列头或行头。
可选的,在对待解析文件进行解析后,该方法还包括:将解析后所得到的数据导入预设数据库。
进一步地,可选的,在将解析后所得到的数据导入预设数据库之前,该方法还包括:接收数据处理指令,数据处理指令中包含数据处理方式及数据处理速度;按照数据处理指令中的数据处理方式及数据处理速度读取数据;将读取的数据赋值给预设数据结构,以通过预设数据结构将数据导入预设数据库。
可选的,在获取存储有待解析文件的模板文件之前,该方法还包括:获取待解析文件的数据存储格式;判断待解析文件的数据存储格式与模板文件是否相同;如果待解析文件的数据存储格式与模板文件不同,则在待解析文件中插入预设存储单元,并定义预设存储单元用于存储待解析文件的行含义或者列含义,以将待解析文件的数据存储格式转换为与模板文件相同;或者,将待解析文件导入模板文件,并在模板文件的预设存储单元中填写待解析文件的行含义或者列含义。
根据本发明实施例的另一个方面,提供了一种文件解析装置,包括:获取模块,用于获取存储有待解析文件的模板文件,模板文件中具有存储待解析文件的行含义或者列含义的预设存储单元;提取模块,用于从预设存储单元中获取待解析文件的行含义或者列含义;解析模块,用于根据获取的待解析文件的行含义或者列含义,对待解析文件进行解析。
可选的,预设存储单元为列头或行头。
可选的,该装置还包括:导入模块,用于在对待解析文件进行解析后,将解析后所得到的数据导入预设数据库。
进一步地,可选的,该装置还包括:接收模块,用于在将解析后所得到的数据导入预设数据库之前,接收数据处理指令,数据处理指令中包含数据处理方式及数据处理速度;读取模块,用于按照数据处理指令中的数据处理方式及数据处理速度读取数据;赋值模块,用于将读取的数据赋值给预设数据结构,以通过预设数据结构将数据导入预设数据库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611208306.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种分布式数据库的操作方法
- 下一篇:关键词的指标数据分析方法及装置