[发明专利]一种台风数据的质量评估与修复方法在审
申请号: | 201711220780.0 | 申请日: | 2017-11-29 |
公开(公告)号: | CN108830029A | 公开(公告)日: | 2018-11-16 |
发明(设计)人: | 黄冬梅;赵丹枫;郑霞;张烨宜;刘新阳 | 申请(专利权)人: | 上海海洋大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 上海卓阳知识产权代理事务所(普通合伙) 31262 | 代理人: | 周春洪 |
地址: | 201306 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 台风 修复 数据完整性 质量评估 数据一致性 时间相似性 一致性修复 防护措施 辅助决策 经济损失 人员伤亡 数据特性 数据修复 度量 评估 判定 表现 分析 | ||
本发明涉及一种台风数据的质量评估与修复方法,所述方法包括以下步骤:步骤S1、获取原始台风数据;步骤S2、分析台风数据特性,对台风数据进行描述;步骤S3、台风数据质量评估,包括步骤S31:台风数据完整性评估;步骤S32:台风数据一致性评估;步骤S4、台风数据修复,且按照数据完整性修复、一致性修复的顺序对台风数据进行修复;包括步骤S41:台风数据完整性修复;步骤S42:台风数据一致性修复。其优点表现在:可以判断具有多要素的台风数据质量以及对其进行修复,为台风时间相似性度量奠定基础,使得相似台风的判定更加准确,可以为相关部门提供便捷的辅助决策,做好防护措施,减少其带来的经济损失和人员伤亡。
技术领域
本发明涉及具有多要素的台风数据质量评估与修复技术领域,具体地说,是一种台风数据的质量评估与修复方法。
背景技术
随着信息技术的不断发展,数据呈爆炸式增长,数据质量问题已经引起高度重视。对于社会调查数据,文献(中国残联“动态更新第三方评估”课题组. 社会调查及数据质量评估研究进展[J].调查世界,2017(10):60-65)按照社会调查的流程梳理了调查及其数据质量评估;对于周期性普查数据,文献(陶然. 周期性普查数据质量评估方法与适用性研究[J].统计研究,2014, 31(8):66-72)介绍了其评估方法及其适用性;对于关联数据,文献(姜恩波, 王振蒙.关联数据质量评估研究综述[J].情报杂志,2016,35(4):171-176) 对其质量评估进行了综述;对于作战数据,文献(刘立军.作战数据质量模型构建与质量评估[J].火炮发射与控制学报,2017,38(03):37-41)构建了质量评估模型对其质量进行评估。上述数据均没有涉及到海洋领域,文献(郑琳,刘艳,崔文林,等.海洋监测数据质量评估研究[J].海洋通报, 2014(2):228-234)提出了海洋监测数据质量评估的方法,但是该方法主要针对正态分布的数据,而台风数据一般不满足正态分布。本发明研究台风数据的完整性和一致性评估与修复问题。
目前,在数据完整性方面已经取得了一些研究结果,然而,现有研究结果均无法解决数据完整性评估。文献(Biswas J,Naumann F,Qiu Q.Assessing the Completeness ofSensor Data[C]//Database Systems for Advanced Applications,InternationalConference,DASFAA 2006,Singapore,April 12-15,2006,Proceedings.DBLP,2006:717-732.)提出了一种在传感器网络环境下信息内容缺失模型,该方法适用于在传感器网络中对缺失数据进行实时监测。然而,在实际应用中,大量数据是历史数据,人们无法再现其获取的实时过程,因此无法用该方法来度量数据的完整性。文献(Nakashima H, Wellman M,Weiss G,et al.Completeness of integrated information sources[J].InformationSystems,2004,29(7):583-615)研究了在多信息源集成环境下,如何度量集成后的信息相对于所有信息源中信息的完整程度。该方法需要知道信息源的完整性,然后通过定义的集成操作来计算集成后的数据源的完整性。然而,在实际应用中,若没有记录集成数据的世系,则无法使用该方法来度量集成数据的完整性。除此以外,现有方法均没有考虑数据质量其他特性对完整性的影响。为了解决上述问题,文献(刘永楠,邹兆年,李建中,等.数据完整性的评估方法[J].计算机研究与发展,2013, 50(s1):230-238)提出了一种具体的关系数据完整性度量,但该方法适合普通的关系数据,对具有时间特性的台风时间序列不适合。
近年来随着数据质量越来越引起人们的重视,越来越多的规则被提出用来描述数据的一致性。主要有以下几种:否定约束、包含依赖、外键约束和函数依赖、聚集约束、元组生成和等值生成依赖.同时有多种修复方式,例如:对称差分修复、子集修复、基数修复、基于更新的修复、投影连接修复等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海海洋大学,未经上海海洋大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711220780.0/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用