[发明专利]一种数据处理的方法及装置有效
申请号: | 201711489494.4 | 申请日: | 2017-12-29 |
公开(公告)号: | CN110019169B | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 王晓春;马军 | 申请(专利权)人: | 中国移动通信集团陕西有限公司;中国移动通信集团公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/22 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘 |
地址: | 710075*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 | ||
1.一种数据处理的方法,其特征在于,所述方法包括:
获取待处理数据;所述待处理数据按行排列;
识别所述待处理数据的每个数据字段的属性及位置;
按照数据字段在行内的位置,确定所述数据字段所属的列位置;
根据同一列中的各数据字段的属性,确定该列的属性;
对属性与所在列的属性不同的数据字段进行修正处理。
2.如权利要求1所述的方法,其特征在于,所述对属性与所在列的属性不同的数据字段进行修正处理,包括:
若所述数据字段的属性为未识别的,则将所述数据字段与相邻的数据字段合并,识别合并后的数据字段的属性,并按照列的属性确定所述合并后的数据字段在行内的位置;
若所述数据字段的属性为多个,则将所述数据字段分割为与所述多个属性中与每个属性相对的多个数据字段,并按照列的属性确定所述多个数据字段的在行内的位置。
3.如权利要求2所述的方法,其特征在于,所述识别合并后的数据字段的属性,包括:
将各列的属性确定为所述待处理数据的属性集合中的属性;
从所述待处理数据的属性集合中确定所述合并后的数据字段的属性。
4.如权利要求1所述的方法,其特征在于,所述根据同一列中的各数据字段的属性,确定该列的属性,包括:
将同一列的各数据字段的属性占该列识别出的多个属性的比例大于第一阈值的属性,确定为该列的属性。
5.如权利要求1所述的方法,其特征在于,所述对属性与所在列的属性不同的数据字段进行修正处理,还包括:
将所述待处理数据中相邻行的数据中,前一行数据的最后一个数据字段与后一行的第一个数据字段为未识别属性的数据字段,则将所述相邻行的数据合并为一行数据,并将所述前一行数据的最后一个数据字段与所述后一行的第一个数据字段合并,识别合并后的数据字段的属性,并按照列的属性确定所述合并后的数据字段在行内的位置。
6.如权利要求1-5任一项所述的方法,其特征在于,所述对属性与所在列的属性不同的数据字段进行修正处理之后,还包括:
对列进行重整,重整后的每列具有一个属性且按照同一属性的数据字段的数量进行列的排序;
按照所述各数据字段的属性及重整后的列,调整所述各数据字段所在的行内位置,得到调整后的所述待处理数据。
7.一种数据处理的装置,其特征在于,所述装置包括:
获取单元,用于获取待处理数据;所述待处理数据按行排列;
处理单元,用于识别所述待处理数据的每个数据字段的属性及位置;按照数据字段在行内的位置,确定所述数据字段所属的列位置;根据同一列中的各数据字段的属性,确定该列的属性;对属性与所在列的属性不同的数据字段进行修正处理。
8.如权利要求7所述的装置,其特征在于,所述处理装置还用于:
若所述数据字段的属性为未识别的,则将所述数据字段与相邻的数据字段合并,识别合并后的数据字段的属性,并按照列的属性确定所述合并后的数据字段在行内的位置;
若所述数据字段的属性为多个,则将所述数据字段分割为与所述多个属性中与每个属性相对的多个数据字段,并按照列的属性确定所述多个数据字段的在行内的位置。
9.如权利要求8所述的装置,其特征在于,所述处理单元还用于:
将各列的属性确定为所述待处理数据的属性集合中的属性;
从所述待处理数据的属性集合中确定所述合并后的数据字段的属性。
10.如权利要求7所述的装置,其特征在于,所述处理单元还用于:
将同一列的各数据字段的属性占该列识别出的多个属性的比例大于第一阈值的属性,确定为该列的属性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团陕西有限公司;中国移动通信集团公司,未经中国移动通信集团陕西有限公司;中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711489494.4/1.html,转载请声明来源钻瓜专利网。