[发明专利]确定标准数据元的方法、装置、设备及存储介质在审
申请号: | 202111674685.4 | 申请日: | 2021-12-31 |
公开(公告)号: | CN114328600A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 石金普;王慧敏;冯小凯;姚素雅 | 申请(专利权)人: | 讯飞智元信息科技有限公司 |
主分类号: | G06F16/2452 | 分类号: | G06F16/2452;G06F16/2455;G06F16/248 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 郄晨芳 |
地址: | 230088 安徽省合肥市高*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 确定 标准 数据 方法 装置 设备 存储 介质 | ||
本申请提供了一种确定标准数据元的方法、装置、设备及存储介质,该方法包括:获得目标数据元的至少一个特征信息;基于目标数据元的各特征信息,从标准数据元库中确定出与目标数据元匹配的第一数据元集合,从历史对标记录库中确定出目标数据元对应的第二数据元集合;按照第二数据元集合中第二标准数据元的标准化次数,确定第二标准数据元的推荐评分;结合第一数据元集合中各第一标准数据元的匹配度以及第二数据元集合中各第二标准数据元的推荐评分,从第一数据元集合和第二数据元集合中确定用于标准化目标数据元的至少一个第一候选标准数据元。本申请的方案可以提升标准数据元匹配的准确率。
技术领域
本申请涉及数据处理技术领域,更具体的说,是涉及一种确定标准数据元的方法、装置、设备及存储介质。
背景技术
随着信息化与数字化的不断发展,企业可以基于数据中台进行数据规整。
在数据规整阶段需要进行数据元的标准化。数据元的标准化是指将数据元转化为符合行业标准或者国家标准等标准规范的标准数据元。基于此,在数据元的标准化过程中,需要确定出数据元匹配的标准数据元。目前,很难准确地从标准数据元库中匹配出数据元适合的标准数据元,使得标准数据元的匹配准确率较低。
发明内容
鉴于上述问题,本申请提供了一种确定标准数据元的方法、装置、设备及存储介质,以提升标准数据元匹配的准确率。具体方案如下:
在本申请的第一方面,提供了一种确定标准数据元的方法,包括:
获得待标准化的目标数据元的至少一个特征信息;
基于所述目标数据元的各特征信息,从标准数据元库中确定出与所述目标数据元匹配的第一数据元集合,所述第一数据元集合包括:所述标准数据元库中与所述目标数据元匹配的各第一标准数据元,以及所述第一标准数据元与所述目标数据元的匹配度;
基于所述目标数据元的各特征信息,从历史对标记录库中确定出所述目标数据元对应的第二数据元集合,所述历史对标记录库中存储有:历史上被标准化过的非标准数据元的特征信息,所述非标准数据元历史上被标准化后的至少一个标准数据元,以及,所述非标准数据元历史上分别被标准化为各标准数据元的标准化次数;所述第二数据元集合中包括:所述目标数据元历史上被标准化后的各第二标准数据元以及所述第二标准数据元对应的标准化次数;
按照所述第二数据元集合中所述第二标准数据元的标准化次数,确定所述第二标准数据元的推荐评分,其中,第二标准数据元的标准化次数越多,所述第二标准数据元的推荐评分越高,所述第二标准数据元的推荐评分用于表征所述第二标准数据元适合作为所述目标数据元的标准数据元的适合程度;
结合所述第一数据元集合中各第一标准数据元的匹配度以及第二数据元集合中各第二标准数据元的推荐评分,从所述第一数据元集合和第二数据元集合中确定用于标准化所述目标数据元的至少一个第一候选标准数据元。
在一种可能的实现方式中,所述结合所述第一数据元集合中各第一标准数据元的匹配度以及第二数据元集合中各第二标准数据元的推荐评分,从所述第一数据元集合和第二数据元集合中确定用于标准化所述目标数据元的至少一个第一候选标准数据元,包括:
结合所述第一数据元集合中各第一标准数据元的匹配度以及第二数据元集合中各第二标准数据元的推荐评分,确定所述第一数据元集合和第二数据元集合中各标准数据元的第一综合评分;
生成用于标准化所述目标数据元的第一候选标准化列表,所述第一候选标准化列表中包括:从所述第一数据元集合和第二数据元集合中确定出的第一综合评分较高的至少一个第一候选标准数据元。
在又一种可能的实现方式中,所述第一候选标准化列表中还包括:所述第一候选标准数据元的第一综合评分;
所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于讯飞智元信息科技有限公司,未经讯飞智元信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111674685.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种便于维修的液压系统
- 下一篇:一种染色体核型AI分析检测仪
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置