[发明专利]医学时序数据的缺失值处理方法、装置、设备及存储介质在审
| 申请号: | 202210082206.8 | 申请日: | 2022-01-24 |
| 公开(公告)号: | CN114550909A | 公开(公告)日: | 2022-05-27 |
| 发明(设计)人: | 吴静依;李青;周勋;李鹏飞 | 申请(专利权)人: | 杭州未名信科科技有限公司;浙江省北大信息技术高等研究院 |
| 主分类号: | G16H50/20 | 分类号: | G16H50/20;G16H50/70;G06F16/906 |
| 代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 付婧 |
| 地址: | 311200 浙江省杭州市萧*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 医学 时序 数据 缺失 处理 方法 装置 设备 存储 介质 | ||
本申请公开了一种医学时序数据的缺失值处理方法、装置、设备及存储介质,包括:获取待填补的时序变量以及与待填补的变量相关的变量;将相关的变量分为等周期时序变量集合、等比例周期时序变量集合、不等周期时序变量集合和非时序变量集合;对等周期时序变量集合以及非时序变量集合进行匹配,得到第一协变量集合以及第四协变量集合,对等比例周期时序变量集合以及不等周期时序变量集合进行预变换,得到第二协变量集合以及第三协变量集合;根据待填补的时序变量、第一至第四协变量集合以及自回归模型构建缺失值填补模型,将待填补的时序变量输入缺失值填补模型,得到待填补的缺失值。该方法可以有效提升医学领域时序数据填补的效率和质量。
技术领域
本发明涉及数据处理技术领域,特别涉及一种医学时序数据的缺失值处理方法、装置、设备及存储介质。
背景技术
时序数据是医学研究领域一种重要的数据类型,常见的医学时序数据包括重症监护室中获取的生命体征监测数据,药物代谢过程中体内药物浓度数据,可穿戴设备实时获取的健康数据等。医学时序数据能够提供人体健康状态变化的连续性信息,在医学临床决策支持领域是一种宝贵的数据资源。许多临床决策支持模型的构建均需依赖于完整的时序数据信息,对患者的临床预后进行实时预测,从而提高临床决策效率。然而在真实医疗场景的数据采集过程中,由于数据采集规范的不完善、数据采集能力限制或是数据传输误差等原因,时序数据常常会有缺失、断点的问题。这严重阻碍了基于时序数据构建临床决策支持模型以辅助临床决策的效率。
目前,针对医学时序数据的常用处理方法包括删除和填补两大类。删除法会造成数据信息丢失,无法发挥数据的最大利用价值。而常用的时序数据填补方法常基于单个时序变量自身数据构建统计模型或机器学习模型对时序数据的缺失值进行填补。该填补方法往往未能利用与缺失时序变量共同记录的其他时序变量的有效信息,因此数据填补的有效性受到一定限制。
发明内容
本申请实施例提供了一种医学时序数据的缺失值处理方法、装置、设备及存储介质。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
第一方面,本申请实施例提供了一种医学时序数据的缺失值处理方法,包括:
获取待填补的时序变量,以及与待填补的时序变量具有较强相关性的变量;
将与待填补的时序变量相关的变量分为等周期的时序变量集合、等比例周期的时序变量集合、不等周期的时序变量集合以及非时序变量集合;
对等周期的时序变量集合以及非时序变量集合进行数据匹配,分别得到第一协变量集合以及第四协变量集合,对等比例周期的时序变量集合以及不等周期的时序变量集合进行预变换,分别得到第二协变量集合以及第三协变量集合;
根据待填补的时序变量、第一协变量集合、第二协变量集合、第三协变量集合、第四协变量集合以及自回归模型构建缺失值填补模型,得到构建好的缺失值填补模型;
将待填补的时序变量输入缺失值填补模型,得到待填补的时序变量的缺失值。
在一个实施例中,将与待填补的时序变量相关的变量分为等周期的时序变量集合、等比例周期的时序变量集合、不等周期的时序变量集合以及非时序变量集合,包括:
将与待填补的时序变量相关的变量分为时序变量集合以及非时序变量集合;
比较时序变量集合中的每一个时序变量与待填补的时序变量的时序特征是否一致;
若时序变量集合中的时序变量与待填补的时序变量的时序周期相同,则将时序变量归类于等周期的时序变量集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州未名信科科技有限公司;浙江省北大信息技术高等研究院,未经杭州未名信科科技有限公司;浙江省北大信息技术高等研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210082206.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于负角整型的双传动冲压模具
- 下一篇:空调器及其除霜控制方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





