[发明专利]文件处理方法和装置、计算设备及存储介质在审
申请号: | 201810975914.8 | 申请日: | 2018-08-24 |
公开(公告)号: | CN109408468A | 公开(公告)日: | 2019-03-01 |
发明(设计)人: | 王强 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/16 | 分类号: | G06F16/16;G06F16/178 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 吴肖肖 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文件处理 方法和装置 存储介质 分片信息 计算设备 业务文件 逻辑分割 文件分割 预设 解析 | ||
1.一种文件处理方法,包括:
按照预设的文件分割策略对业务文件进行逻辑分割,得到多个逻辑分片信息;
对所述多个逻辑分片信息对应所述业务文件中的数据分别进行解析。
2.根据权利要求1所述的方法,其中所述预设的文件分割策略包括按照预设的字节数对业务文件进行逻辑分割。
3.根据权利要求2所述的方法,其中所述按照预设的文件分割策略对业务文件进行逻辑分割,得到多个逻辑分片信息步骤包括:
按照所述预设的字节数从所述业务文件的文件头位置获取所述多个逻辑分片信息中每个逻辑分片信息的起始位置和终止位置。
4.根据权利要求3所述的方法,其中所述按照所述预设的字节数从所述业务文件的文件头位置获取所述多个逻辑分片信息中每个逻辑分片信息的起始位置和终止位置步骤包括:
创建指针,并将所述指针的初始位置设置为所述业务文件的文件头位置;
从配置信息中获取所述预设的字节数,从所述文件头位置开始控制所述指针每次移动所述预设的字节数,直到所述指针移动到所述业务文件的结束位置为止;
获取所述指针每次移动前后的移动前位置和移动后位置,将所述移动前位置和所述移动后位置分别作为对应逻辑分片信息的起始位置和终止位置。
5.根据权利要求3所述的方法,其中在按照所述预设的字节数从所述业务文件的文件头位置获取所述多个逻辑分片信息中每个逻辑分片信息的起始位置和终止位置步骤之后还包括:
判断每个所述逻辑分片信息的终止位置是否是所在行的结束位置;
若所述终止位置不是所在行的结束位置则将所在行的结束位置作为所述终止位置。
6.根据权利要求3所述的方法,其中所述对所述多个逻辑分片信息对应所示业务文件中的数据分别进行解析步骤包括:
创建多个线程或多个进程,每个所述线程或每个所述进程对应一个所述逻辑分片信息;
将每个所述逻辑分片信息分配至对应的线程或进程;
每个所述线程或每个所述进程根据对应的逻辑分片信息的起始位置和终止位置对所述业务文件中对应的数据进行解析,得到每个所述逻辑分片信息对应的数据的解析结果。
7.根据权利要求6所述的方法,其中在所述每个所述线程根据对应的逻辑分片信息的起始位置和终止位置对所述业务文件中对应的数据进行解析,得到每个所述逻辑分片信息对应的数据的解析结果步骤之后还包括:
对每个所述逻辑分片信息对应的数据的解析结果进行结构化处理。
8.根据权利要求6所述的方法,其中所述多个进程位于不同的处理器上。
9.一种文件处理装置,包括:
分割器,被配置为按照预设的文件分割策略对业务文件进行逻辑分割,得到多个逻辑分片信息;
解析器,被配置为对所述多个逻辑分片信息对应所述业务文件中的数据分别进行解析。
10.根据权利要求9所述的装置,其中所述预设的文件分割策略包括按照预设的字节数对业务文件进行逻辑分割。
11.根据权利要求10所述的装置,其中所述分割器进一步被配置为:
按照所述预设的字节数从所述业务文件的文件头位置获取所述多个逻辑分片信息中每个逻辑分片信息的起始位置和终止位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810975914.8/1.html,转载请声明来源钻瓜专利网。