[发明专利]一种输变电工程造价数据集成管理系统及其方法在审
申请号: | 202211345225.1 | 申请日: | 2022-10-31 |
公开(公告)号: | CN115688729A | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 陈凯玲;王晓晖;顾闻;史松峰;韩东;徐雪莲;吴恩琦 | 申请(专利权)人: | 国网上海市电力公司 |
主分类号: | G06F40/186 | 分类号: | G06F40/186;G06F40/18;G06F40/174;G06F16/13;G06F16/14;G06F16/215;G06F16/25 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 叶敏华 |
地址: | 200122 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 变电 工程造价 数据 集成 管理 系统 及其 方法 | ||
1.一种输变电工程造价数据集成管理系统,其特征在于,包括依次连接的预处理模块、关键词检索模块、标准化模块、数据集成填报模块,所述预处理模块用于对16项数据源的文件格式进行相应处理,避免数据源文件中存在的图片文字识别问题;
所述关键词检索模块用于从收集的输变电工程造价数据中查询获得关键造价数据;
所述标准化模块用于对关键造价数据进行数字标准化处理,得到标准化数据格式的造价数据;
所述数据集成填报模块用于将标准化数据格式的造价数据对应填充至设定的数据收集模板中。
2.一种输变电工程造价数据集成管理方法,其特征在于,包括以下步骤:
S1、对16项数据源的文件格式进行规范化处理,包括图像处理、OCR文字识别、图片文字识别,得到word格式文件;
S2、基于混合索引结构,从word格式文件中定位出关键造价数据所属数据源文件;
S3、基于检索技术从定位出的数据源文件中搜索获取对应关键造价数据;
S4、基于XML的元数据标准,对关键造价数据进行数字标准化处理,得到标准化数据格式的造价数据;
S5、对标准化数据格式的造价数据进行数据校验以及融合处理,之后将关键造价数据对应填充至设定的五类数据收集模板中。
3.根据权利要求2所述的一种输变电工程造价数据集成管理方法,其特征在于,所述步骤S2中混合索引结构具体为基于B+树与倒排索引技术的双层索引结构,包括第一层树形索引结构和第二层倒排表索引结构。
4.根据权利要求3所述的一种输变电工程造价数据集成管理方法,其特征在于,所述第一层树形索引结构用于建立索引的数据队形所包含的属性,在该层索引中,数据的所有具体属性全部存储在非叶子结点中,而B+树的所有叶子结点中则存储三部分信息Ai、PType、Pointer,表示的含义分别为:
(1)Ai是索引对象的数据属性,其中n数据集中所包含的所有属性个数,i∈[1,n];
(2)PType为指针类型,具体类型有PType{Inverted_index,B+树};
(3)Pointer为指向第二层索引的指针,根据属性值的不同数据类型,该指针指向不同的索引结构,即指向倒排表表头或B+树的根结点。
5.根据权利要求4所述的一种输变电工程造价数据集成管理方法,其特征在于,所述第二层倒排表索引结构用于建立第一层属性所对应数据值的索引,包括为数值型数据建立的B+树索引结构和为字符型数据建立的倒排表索引结构,其中,具体的数据值均存储在B+树索引结构的非叶子结点中,且叶子结点都是有序排列的且包含索引文件的三部分信息ARVS、Loc、Doc,分别表示的含义是:
(1)ARVS为第R个属性的第S个属性值,R∈[1,n2],s∈[1,p],n2为数据集中包含的数值属性的个数,P为第R个属性的属性值个数;
(2)Loc为包含此属性值的文件所在的位置信息;
(3)Doc为包含查询关键词的文件编号,Doc是唯一的;
倒排索引分为两个部分,一个是由不同的关键词组成的索引表,称为词典,其中保存了各种中文关键字以及这些词汇所对应的统计信息;另一个部分是由每个索引词出现过的文档集合,及其位置信息组成,也称为记录表,第二层的倒排索引结构中具体包含AiVj、Doc、Loc、F四部分信息,表示的含义分别为:
(1)AiVj为第i个属性的第j个属性值,i∈[1,n1]、j∈1,m],n1为字符属性的个数,m为第i个属性包含的属性值的个数;
(2)Doc为所查询条件的属性值所在的文件编号,每个文件编号唯一;
(3)Loc为包含查询关键词的文件所在的位置信息;
(4)F为查询关键词在文件中出现的频率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网上海市电力公司,未经国网上海市电力公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211345225.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种集控系统
- 下一篇:船用氨燃料供给系统及其燃料回收装置和方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置