[发明专利]数据字典标准化处理方法、装置、设备及存储介质有效
| 申请号: | 202011551746.3 | 申请日: | 2020-12-24 |
| 公开(公告)号: | CN112527970B | 公开(公告)日: | 2022-11-15 |
| 发明(设计)人: | 李佳妮;刘威浩;黄炜;周骏;谢华雯;陆燕;徐宏杰 | 申请(专利权)人: | 上海浦东发展银行股份有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/36 |
| 代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 刘飞;贾磊 |
| 地址: | 200002 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据 字典 标准化 处理 方法 装置 设备 存储 介质 | ||
本说明书实施例提供了一种数据字典标准化处理方法、装置、设备及存储介质,该方法包括:确认数据字典中目标字段下的当前字段值是否与数据标准中对应字段下的字段值全字匹配;当所述当前字段值不与所述对应字段下的任何字段值全字匹配时,获取第一记录与所述数据标准中每条记录在指定特征下的相似度;所述第一记录为所述当前字段值在所述数据字典中对应的记录;根据所述相似度确定所述数据标准中与所述第一记录匹配的目标记录;读取所述第一记录和所述目标记录,并在将其拼接为一条记录后写入目标数据表;按照预设的标准化处理逻辑对所述目标数据表中的记录进行自动处理。本说明书实施例可以提高数据字典标准化处理的效率和准确性。
技术领域
本说明书涉及数据处理技术领域,尤其是涉及一种数据字典标准化处理方法、装置、设备及存储介质。
背景技术
数据字典(Data dictionary)是指对数据的数据项、数据结构、数据流、数据存储、处理逻辑等进行定义和描述,是对数据流程图中的各个元素做出详细的定义和描述,使用数据字典为简单的建模项目。简而言之,数据字典是描述数据的信息集合,是对系统中使用的所有数据元素的定义的集合。数据字典对于应用系统的数据库开发等具有重要意义。
为了有利于保证数据字典的正确性并符合相关标准要求,数据字典一般需要进行标准化处理。传统的数据字典标准化处理主要通过人工处理实现,即通过人工方式将数据字典与数据标准进行对比匹配。显然,这种人工处理的方式效率低且容易出错。
发明内容
本说明书实施例的目的在于提供一种数据字典标准化处理方法、装置、设备及存储介质,以提高数据字典标准化处理的效率和准确性。
为达到上述目的,一方面,本说明书实施例提供了一种数据字典标准化处理方法,包括:
确认数据字典中目标字段下的当前字段值是否与数据标准中对应字段下的字段值全字匹配;
当所述当前字段值不与所述对应字段下的任何字段值全字匹配时,获取第一记录与所述数据标准中每条记录在指定特征下的相似度;所述第一记录为所述当前字段值在所述数据字典中对应的记录;
根据所述相似度确定所述数据标准中与所述第一记录匹配的目标记录;
读取所述第一记录和所述目标记录,并在将其拼接为一条记录后写入目标数据表;
按照预设的标准化处理逻辑对所述目标数据表中的记录进行自动处理。
本说明书一实施例中,所述数据字典标准化处理方法还包括:
当所述当前字段值与所述对应字段下的一个字段值全字匹配时,读取第一记录和第二记录,并在将其拼接为一条记录后写入所述目标数据表;所述第二记录为所述一个字段值在所述数据标准中对应的记录。
本说明书一实施例中,所述获取第一记录与所述数据标准中每条记录在指定特征下的相似度,包括:
对所述第一记录中指定字段进行向量化,获得第一向量;
对所述数据标准中每条记录中指定字段进行向量化,对应获得所述每条记录中指定字段的第二向量;
确定所述第一向量与所述每条记录中指定字段的第二向量的相似度,形成相似度集合。
本说明书一实施例中,所述根据所述相似度确定所述数据标准中与所述第一记录匹配的目标记录,包括:
确定相似度集合中的最大值;
确认所述最大值是否大于相似度阈值;
当所述最大值大于所述相似度阈值时,将所述数据标准中与所述最大值对应的记录,作为与所述第一记录匹配的目标记录。
本说明书一实施例中,所述获取第一记录与所述数据标准中每条记录在指定特征下的相似度,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海浦东发展银行股份有限公司,未经上海浦东发展银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011551746.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种先进简化的小堆非能动专设安全系统
- 下一篇:一种市政排水系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





