[发明专利]一种面向文献类数字资源元数据的质量评价方法及系统在审
| 申请号: | 201810707861.1 | 申请日: | 2018-07-02 |
| 公开(公告)号: | CN109299062A | 公开(公告)日: | 2019-02-01 |
| 发明(设计)人: | 胡中贵;刘海日 | 申请(专利权)人: | 北京市天元网络技术股份有限公司 |
| 主分类号: | G06F16/21 | 分类号: | G06F16/21;G06F16/2458;G06F16/28 |
| 代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;李相雨 |
| 地址: | 100193 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数字资源 元数据 质量评价 质量评价指标 评价指标 核查结果 构建 权重 核查 | ||
本发明提供一种面向文献类数字资源元数据的质量评价方法及系统,所述方法包括:S1,根据目标文献类数字资源的自身属性,构建所述目标文献类数字资源中元数据的质量评价指标体系;S2,根据所述质量评价指标体系中的各评价指标,对各所述元数据进行各项核查;S3,根据各项核查结果对应的分数和各所述评价指标的权重,计算所述元数据的总得分。本发明实现了对面向文献类数字资源元数据的质量评价,且质量评价精度高。
技术领域
本发明属于图书馆学技术领域,更具体地,涉及一种面向文献类数字资源元数据的质量评价方法及系统。
背景技术
随着科学技术的不断进步发展、全球信息化进程持续推进,文献类数据资源的数量和体量以前所未有的速度增长。元数据作为描述这些数据资源的重要数据,如何全面系统的检查和评价资源元数据的质量直接关乎数据后续的使用。
目前对于文献类数字资源元数据的质量评价缺乏一套相对完整的、全面的、灵活的、可落地的质量评价方法,大多数现存的相关评价方法只是在理论层面进行了阐述,仅仅从分析评价的维度进行介绍,并没有给出针对文件、记录和字段属性的具体评价规则,对文献类数字资源元数据的质量评价方法的落地实施缺乏实质性的指导意义。
发明内容
为克服上述现有面向文献类数字资源元数据的质量评价方法只是在理论上进行阐述,无法落地实施的问题或者至少部分地解决上述问题,本发明提供一种面向文献类数字资源元数据的质量评价方法及系统。
根据本发明的第一方面,提供一种面向文献类数字资源元数据的质量评价方法,包括:
S1,根据目标文献类数字资源的自身属性,构建所述目标文献类数字资源中元数据的质量评价指标体系;
S2,根据所述质量评价指标体系中的各评价指标,对各所述元数据进行各项核查;
S3,根据各项核查结果对应的分数和各所述评价指标的权重,计算所述元数据的总得分。
具体地,所述质量评价指标体系包括完整性、正确性、一致性、唯一性和时效性中的一种或多种评价指标;
相应地,所述步骤S2具体包括:
根据所述完整性评价指标,核查所述元数据中的数据实体是否缺失、数据文件是否缺失、数据记录是否缺失、数据结构是否缺失和记录中字段内容是否缺失中的一种或多种;
根据所述正确性评价指标,核查所述元数据的合法性、有效性、是否存在乱码和是否存在统一值替代中的一种或多种;
根据所述一致性评价指标,核查所述元数据的数据逻辑一致性和/或内容格式一致性;
根据所述唯一性评价指标,核查所述元数据的数据记录唯一性和/或关键属性值唯一性;
根据所述时效性指标,核查所述元数据的数据内容新颖性和/或链接地址有效性。
具体地,所述步骤S1和S3之间还包括:
根据所述自身属性所属的级别,对所述自身属性对应的元数据进行分类;
相应地,所述步骤S2还包括:
根据每一类所述元数据对应的评价指标,对每一类所述元数据进行核查;
其中,每一类所述元数据与所述评价指标预先关联存储。
具体地,根据所述自身属性所属的级别,对所述自身属性对应的元数据进行分类的步骤具体包括:
根据所述自身属性所属的级别,将所述自身属性对应的元数据分为文件级元数据、记录级元数据和字段级元数据中的一种或多种。
具体地,根据每一类所述元数据对应的评价指标,对每一类所述元数据进行核查的步骤具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市天元网络技术股份有限公司,未经北京市天元网络技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810707861.1/2.html,转载请声明来源钻瓜专利网。





