[发明专利]一种多源主附实体同一性甄别及数据自补的处理方法有效
申请号: | 202210592302.7 | 申请日: | 2022-05-27 |
公开(公告)号: | CN114969041B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 吴峰;张朝宗;李银生;王红;聂永川;任雁;毋鹏杰;杨扬;刘淼;张义倩 | 申请(专利权)人: | 河北省科学技术情报研究院(河北省科技创新战略研究院) |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/25;G06F16/28 |
代理公司: | 石家庄中和昇知识产权代理事务所(特殊普通合伙) 13145 | 代理人: | 付会平 |
地址: | 050051 *** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多源主附 实体 同一性 甄别 数据 处理 方法 | ||
1.一种多源主附实体同一性甄别及数据自补的处理方法,其特征在于,具体包括以下步骤:
A1.从源A的实体题录项数据库EFDB提取主实体题录项MEFS、附属实体题录项SEFS,从源A的实体应用场景数据库ESDB提取主实体m(m)与附属实体s(m)之间的应用场景es,从实体静态数据库RSDB提取实体静态库相关实体信息,利用单源同一实体甄别及数据补充器,依据主实体、同场景信息,提取表征单源同一实体的信息,存入同一实体数据库SEDB,并进行数据补充;其中,实体静态数据库RSDB存放来源于同一源的多库的数据;
步骤A1中所述单源同一实体甄别及数据补充器的工作方法为:
A11.从源A的实体静态库数据库RSDB中,读取单源多库数据集合DSB;
A12.从源A的实体题录项数据库EFDB中,读取未入库的库个数N1,设n1=1;
A13.读取库n1的主实体题录项MEFS,获得主实体题录项MEFS的数据集合DSA,同时获得数据集合DSA记录的条数I1,设i1=1;
A14.读取数据集合DSA中的第i1条记录,利用题录项数据的唯一项K,与数据集合DSB中的数据进行匹配,如果匹配成功,则执行步骤A15,如果匹配不成功,执行步骤A19;
A15.提取记录i1对应的主实体m1的表征单源实体同一性的相关信息,写入同一实体数据库SEDB;
A16.从同一实体数据库SEDB中,读取主实体m1在源A中的表征同一实体的相关信息数据集合DSC;
A17.从实体应用场景数据库ESDB中,读取主实体m1对应的附属实体信息集合DSS,利用同场景SS规则,判别具体附属实体s是否存在同一实体;如果存在同一实体,则执行步骤A18,否则,执行步骤A19;
A18.提取具体附属实体s的同一实体相关信息,写入同一实体数据库SEDB;
A19.判断I1i1是否为真,如果为真,则执行i1=i1+1,跳转到步骤A14执行;否则跳转到步骤A110执行;
A110.判断N1n1是否为真,如果为真,则执行n1=n1+1,跳转到步骤A13执行;否则,结束;
A2.从实体静态数据库RSDB提取实体静态库相关实体信息,从源B的实体题录项数据库EFDB提取附属实体题录项SEFS,从源B的实体应用场景数据库ESDB提取主实体m(m)与附属实体s(m)之间的应用场景es,从实体动态数据库RVDB提取动态库实体数据信息,从同一实体数据库SEDB提取同一实体数据信息,利用异源同一实体甄别器,依据规则,判别异源实体的同一性,提取表征异源同一实体的信息,传入异源实体数据增补器,同时存入主实体动态数据库RVDB;其中,实体动态数据库RVDB存放来自于异源且经过整合之后的实体的指标及数据;
A3.从实体动态数据库RVDB提取动态库实体数据信息,从同一实体数据库SEDB提取同一实体数据信息,从异源同一实体甄别器接收同一源同一实体的信息,利用异源实体数据增补器,依据时间最近原则,进行异源实体信息的增补,同时将异源实体增补信息,存入实体动态数据库RVDB;
A4.从同一实体数据库SEDB提取同一实体数据信息,从实体动态数据库RVDB提取动态库实体数据信息,利用实体名录项自动提取生成器,依据实体名录必要项eles,提取实体名录信息,存入实体名录数据库EDDB;
A5.从实体动态数据库RVDB提取动态库实体数据信息,从实体名录数据库EDDB提取实体名录信息,利用子实体自动分离器,依据规则,从实体名录数据库EDDB中自动分离子实体信息,形成子实体名录信息,存入实体名录数据库EDDB。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北省科学技术情报研究院(河北省科技创新战略研究院),未经河北省科学技术情报研究院(河北省科技创新战略研究院)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210592302.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种主题文化创意作品展示台
- 下一篇:一种电池健康状态测试系统