[发明专利]一种多源主附实体同一性甄别及数据自补的处理方法有效

专利信息
申请号: 202210592302.7 申请日: 2022-05-27
公开(公告)号: CN114969041B 公开(公告)日: 2023-06-30
发明(设计)人: 吴峰;张朝宗;李银生;王红;聂永川;任雁;毋鹏杰;杨扬;刘淼;张义倩 申请(专利权)人: 河北省科学技术情报研究院(河北省科技创新战略研究院)
主分类号: G06F16/22 分类号: G06F16/22;G06F16/25;G06F16/28
代理公司: 石家庄中和昇知识产权代理事务所(特殊普通合伙) 13145 代理人: 付会平
地址: 050051 *** 国省代码: 河北;13
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 多源主附 实体 同一性 甄别 数据 处理 方法
【权利要求书】:

1.一种多源主附实体同一性甄别及数据自补的处理方法,其特征在于,具体包括以下步骤:

A1.从源A的实体题录项数据库EFDB提取主实体题录项MEFS、附属实体题录项SEFS,从源A的实体应用场景数据库ESDB提取主实体m(m)与附属实体s(m)之间的应用场景es,从实体静态数据库RSDB提取实体静态库相关实体信息,利用单源同一实体甄别及数据补充器,依据主实体、同场景信息,提取表征单源同一实体的信息,存入同一实体数据库SEDB,并进行数据补充;其中,实体静态数据库RSDB存放来源于同一源的多库的数据;

步骤A1中所述单源同一实体甄别及数据补充器的工作方法为:

A11.从源A的实体静态库数据库RSDB中,读取单源多库数据集合DSB;

A12.从源A的实体题录项数据库EFDB中,读取未入库的库个数N1,设n1=1;

A13.读取库n1的主实体题录项MEFS,获得主实体题录项MEFS的数据集合DSA,同时获得数据集合DSA记录的条数I1,设i1=1;

A14.读取数据集合DSA中的第i1条记录,利用题录项数据的唯一项K,与数据集合DSB中的数据进行匹配,如果匹配成功,则执行步骤A15,如果匹配不成功,执行步骤A19;

A15.提取记录i1对应的主实体m1的表征单源实体同一性的相关信息,写入同一实体数据库SEDB;

A16.从同一实体数据库SEDB中,读取主实体m1在源A中的表征同一实体的相关信息数据集合DSC;

A17.从实体应用场景数据库ESDB中,读取主实体m1对应的附属实体信息集合DSS,利用同场景SS规则,判别具体附属实体s是否存在同一实体;如果存在同一实体,则执行步骤A18,否则,执行步骤A19;

A18.提取具体附属实体s的同一实体相关信息,写入同一实体数据库SEDB;

A19.判断I1i1是否为真,如果为真,则执行i1=i1+1,跳转到步骤A14执行;否则跳转到步骤A110执行;

A110.判断N1n1是否为真,如果为真,则执行n1=n1+1,跳转到步骤A13执行;否则,结束;

A2.从实体静态数据库RSDB提取实体静态库相关实体信息,从源B的实体题录项数据库EFDB提取附属实体题录项SEFS,从源B的实体应用场景数据库ESDB提取主实体m(m)与附属实体s(m)之间的应用场景es,从实体动态数据库RVDB提取动态库实体数据信息,从同一实体数据库SEDB提取同一实体数据信息,利用异源同一实体甄别器,依据规则,判别异源实体的同一性,提取表征异源同一实体的信息,传入异源实体数据增补器,同时存入主实体动态数据库RVDB;其中,实体动态数据库RVDB存放来自于异源且经过整合之后的实体的指标及数据;

A3.从实体动态数据库RVDB提取动态库实体数据信息,从同一实体数据库SEDB提取同一实体数据信息,从异源同一实体甄别器接收同一源同一实体的信息,利用异源实体数据增补器,依据时间最近原则,进行异源实体信息的增补,同时将异源实体增补信息,存入实体动态数据库RVDB;

A4.从同一实体数据库SEDB提取同一实体数据信息,从实体动态数据库RVDB提取动态库实体数据信息,利用实体名录项自动提取生成器,依据实体名录必要项eles,提取实体名录信息,存入实体名录数据库EDDB;

A5.从实体动态数据库RVDB提取动态库实体数据信息,从实体名录数据库EDDB提取实体名录信息,利用子实体自动分离器,依据规则,从实体名录数据库EDDB中自动分离子实体信息,形成子实体名录信息,存入实体名录数据库EDDB。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北省科学技术情报研究院(河北省科技创新战略研究院),未经河北省科学技术情报研究院(河北省科技创新战略研究院)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210592302.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top