[发明专利]一种SQL自动对标的匹配方法及装置在审

专利信息
申请号: 202010674260.2 申请日: 2020-07-14
公开(公告)号: CN111563142A 公开(公告)日: 2020-08-21
发明(设计)人: 张艳清;查文宇;周宇;刘俊良;金日海;王怡君 申请(专利权)人: 成都四方伟业软件股份有限公司
主分类号: G06F16/33 分类号: G06F16/33;G06F40/289;G06F40/247
代理公司: 暂无信息 代理人: 暂无信息
地址: 610041 四川省*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 sql 自动 标的 匹配 方法 装置
【说明书】:

发明公开了一种SQL自动对标的匹配方法及装置,主要涉及数据处理及数据治理领域,用于数据治理中采集到的元数据项与标准间的关联映射,采用本方案,通过对算法链中的同义词、分词、联想等算法的升级,可以在后期优化提升整体的匹配度,让自动对标的匹配度得以提高,减少人工操作的工作量,解决了现有方案匹配度低,必须要名称一致才能匹配,对同义词无法匹配,且当无法通过名称匹配时,需要人工进行大量的操作,过程十分繁琐的问题。

技术领域

本发明涉及数据治理领域,特别涉及一种SQL自动对标的匹配方法及装置。

背景技术

结构化查询语言(Structured Query Language)简称SQL,是一种特殊目的的编程语言,是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统。结构化查询语言是高级的非过程化编程语言,允许用户在高层数据结构上工作。它不要求用户指定对数据的存放方法,也不需要用户了解具体的数据存放方式,所以具有完全不同底层结构的不同数据库系统, 可以使用相同的结构化查询语言作为数据输入与管理的接口。结构化查询语言语句可以嵌套,这使它具有极大的灵活性和强大的功能。SQL可以独立完成数据库生命周期中的全部活动,包括定义关系模式、录入数据、建立数据库、査询、更新、维护、数据库重构、数据库安全性控制等一系列操作,这就为数据库应用系统开发提供了良好的环境,在数据库投入运行后,还可根据需要随时逐步修改模式,且不影响数据库的运行,从而使系统具有良好的可扩充性。

现有的SQL对标方案的操作方式有:第一步,根据数据项的中英文名查询具有相同名字的代码,如果有则进行关联对标;第二步,如果没有中英文都匹配的代码则以英文名进行匹配,如果有则进行关联对标;第三步,如果前两步关联失败,就需要人工指定关联标准。

上述方法的问题在于匹配度低,必须要名称一致才能匹配,对同义词无法匹配,且当无法通过名称匹配时,需要人工进行大量的操作,过程十分繁琐。

发明内容

本发明的目的在于:提供了一种SQL自动对标的匹配方法及装置,解决了现有方案匹配度低,必须要名称一致才能匹配,对同义词无法匹配,且当无法通过名称匹配时,需要人工进行大量的操作,过程十分繁琐的问题。

本发明采用的技术方案如下:

一种SQL自动对标的匹配方法,包括以下步骤:

S1、读取数据项的第一名称,根据第一名称查询是否具有相同名称的标准,如果有则进行关联对标,如果没有则转入步骤S2;

S2、对第一名称进行识别得到第一名称的中文部分为第二名称,得到第一名称的非中文部分为第三名称;

S3、根据第二名称和第三名称中的任意一项查询是否具有相同名称的标准,如果有则进行关联对标,如果没有则转入步骤S4;

S4、根据同义词库第一名称的同义词查询是否具有相同名称的标准,如果有则进行关联对标,如果没有则转入步骤S5;

S5、对第一名称进行分词处理后查询分词是否具有相同名称的标准,如果有则进行关联对标,如果没有则转入步骤S6;

S6、根据第一名称进行人工匹配完成该数据项的关联对标。

采用上述方案,通过对算法链中的同义词、分词、联想等算法的升级,可以在后期优化提升整体的匹配度,让自动对标的匹配度得以提高,减少人工操作的工作量,解决了现有方案匹配度低,必须要名称一致才能匹配,对同义词无法匹配,且当无法通过名称匹配时,需要人工进行大量的操作,过程十分繁琐的问题。

进一步的,所述步骤S4中根据第一名称的同义词查询是否具有相同名称的标准的方法包括以下步骤:

S401、在同义词库中查询第二名称的同义词为第四名称,查询第三名称的同义词为第五名称;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都四方伟业软件股份有限公司,未经成都四方伟业软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010674260.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top