[发明专利]全人群全生命历程健康图谱创建方法、系统及存储介质有效
申请号: | 201810379906.7 | 申请日: | 2018-04-25 |
公开(公告)号: | CN108597588B | 公开(公告)日: | 2020-09-18 |
发明(设计)人: | 薛付忠;张涛;季晓康;刘言训;崔立真;郭伟;苟延农;李德金;高琦;阿力木·达依木;王束康;孙秀彬;刘云霞 | 申请(专利权)人: | 山东大学 |
主分类号: | G16H30/20 | 分类号: | G16H30/20;G16H50/70 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 黄海丽 |
地址: | 250101 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人群 生命 历程 健康 图谱 创建 方法 系统 存储 介质 | ||
本发明公开了全人群全生命历程健康图谱创建方法、系统及存储介质,包括:数据采集;采集医疗卫生行业的全员人口信息、公共卫生信息、电子病历信息、健康体检信息、医疗保险信息和监测信息;数据关联和合并;以个人身份证为唯一索引,将全员人口信息、公共卫生信息、电子病历信息、健康体检信息、医疗保险信息和监测信息中的各个数据表进行相互关联和合并;数据清洗,生成数据库;制定指标;所述指标,包括个体水平上的危险暴露指标、疾病指标、死亡原因指标、疾病负担指标、健康维护指标和健康保障指标;创建健康图谱;所述健康图谱,包括:危险暴露图谱、发病图谱、死亡原因图谱、疾病负担图谱、健康维护图谱或健康保障图谱。
技术领域
本发明涉及全人群全生命历程健康图谱创建方法、系统及存储介质。
背景技术
目前,互联网、云计算和物联网技术的成熟和发展,健康危险因素监测信息化和医疗/卫生信息化的广泛普及,使得健康医疗数据正在以惊人的速度呈几何倍数增长;同时,可穿戴移动医疗和移动健康技术的迅猛发展,促使生物医学领域快速进入“大数据”时代。从而,汇集产生了前所未有的海量健康危险暴露和健康医疗“大数据”资源。这表明“以人群健康和患者数据为中心”的“大数据健康医疗”医-患协同新时代已经来临,即大数据驱动的健康医疗研究、健康医疗实践和健康产业新业态已经成为支撑政策制定、行业发展和产业转化的原动力。现有技术存在的问题是:没有对健康医疗大数据进行合理的利用。
发明内容
为了解决现有技术的不足,本发明提供了全人群全生命历程健康图谱创建方法、系统及存储介质;
作为本发明的第一方面,提出了全人群全生命历程健康图谱创建方法;
全人群全生命历程健康图谱创建方法,包括:
步骤(1):数据采集;采集医疗卫生行业的全员人口信息、公共卫生信息、电子病历信息、健康体检信息、医疗保险信息和监测信息;
步骤(2):数据关联和合并;以个人身份证为唯一索引,将全员人口信息、公共卫生信息、电子病历信息、健康体检信息、医疗保险信息和监测信息中的各个数据表进行相互关联和合并;
步骤(3):数据清洗,生成数据库;
步骤(4):制定指标;所述指标,包括个体水平上的危险暴露指标、疾病指标、死亡原因指标、疾病负担指标、健康维护指标和健康保障指标;
步骤(5):根据步骤(3)得到的数据库和步骤(4)制定的指标,创建健康图谱;所述健康图谱,包括:危险暴露图谱、疾病发病图谱、死亡原因图谱、疾病负担图谱、健康维护图谱或健康保障图谱。
作为本发明的进一步改进,
步骤(31):对数据的数量进行校验,若数据量小于设定人数,则返回步骤(1)继续进行数据采集;
步骤(32):对每一个数据表的每一个字段都进行数据频数统计,生成频数分布表及频数分布直方图,根据频数分布直方图发现数据缺失,则返回步骤(1)继续进行数据采集;根据频数分布直方图发现性别数据差值超过设定阈值,则返回步骤(1)继续进行数据采集;根据频数分布直方图发现数据类型不一致,则返回步骤(1)继续进行数据采集;
步骤(33):逻辑校验;
根据性别进行判断,对不合理内容进行删除;
根据年龄进行判断,对于年龄不相符的特征进行删除;
步骤(34):剔除异常值;
对于数值型变量,以该变量的参考范围的上下限的均值±3倍的标准差作为正常值的参考范围,对于无法得到参考数据的,根据全数据均值±3倍的标准差作为异常值检测;对异常值进行删除;
步骤(35):数据质量控制;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810379906.7/2.html,转载请声明来源钻瓜专利网。