[发明专利]数据处理方法、装置、设备及存储介质在审
申请号: | 202210288257.6 | 申请日: | 2022-03-23 |
公开(公告)号: | CN114613495A | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 叶结保 | 申请(专利权)人: | 康键信息技术(深圳)有限公司 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G16H50/70;G16H20/00;G06K9/62 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 姚维 |
地址: | 518052 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 设备 存储 介质 | ||
本发明涉及数字医疗技术领域,公开了一种数据处理方法、装置、设备及存储介质,用于提高模型训练中医疗数据训练样本的质量,提高AI识别疾病的效果和准确性。包括:通过互联网医疗平台存储包括线上和线下产生的病种全面且样本量充足的高质量历史医疗数据,同时对存储的历史医疗数据进行标签处理和分类处理得到数量多、基础数据完善、且标注全面的样本数据,提高了模型训练样本的质量,有利于模型的训练,提高了AI识别疾病的效果和准确性,进而可以推进医疗在人工智能领域的研究和应用。此外,本发明还涉及云计算技术,医疗平台和医疗数据通过云计算创建和处理。
技术领域
本发明涉及数字医疗技术领域,尤其涉及一种数据处理方法、装置、设备及存储介质。
背景技术
人工智能(Artificial Intelligence,AI)在医学方面主要用于AI导诊、AI阅片、AI问诊、AI面诊、以及AI健康管理等疾病诊断和营养健康各个方面。但是,将人工智能应用到医学的疾病诊断和健康管理,需要获取大量的训练数据,训练具有不同功能的模型,以通过模型进行疾病诊断和健康管理。相关技术中,针对医学方面的数据集,通常是通过传统医院中医生与患者之间交流的问诊方式,医生手动输入患者信息、治疗过程、以及诊断结果等数据,获取数据集,并通过人工的方式对数数据集进行标注得到训练集。但是这种方式不方便形成问诊数据集,且数据集的数量较少,缺乏基础数据,导致数据集的标注不全面,不利于模型的训练,导致AI对某种疾病无法识别,进而会影响AI识别疾病的准确性。
发明内容
本发明提供了一种数据处理方法、装置、设备及存储介质,用于通过互联网医疗平台获取病种全面且样本量充足的高质量医疗数据,同时对获取的医疗数据进行标签和分类处理得到数量多、基础数据完善、且标注全面的样本数据,有利于模型的训练,提高AI的识别疾病效果和准确性,进而可以推进医疗在人工智能领域的研究和应用。
为实现上述目的,本发明第一方面提供了一种数据处理方法,包括:获取医疗平台存储的历史医疗数据;其中,历史医疗数据包括:线上医疗数据和线下医疗数据;线上医疗数据通过线上的方式获取并存储于医疗平台的业务系统;线下医疗数据通过线下的方式获取并上传至医疗平台的业务系统;根据历史医疗数据和预先设置的标签库,为历史医疗数据设置标签,得到历史医疗数据的初始样本数据;其中,标签库至少包括影像标签库、问诊标签库、以及病程标签库;根据预设的分类维度,对初始样本数据进行分类处理,得到不同维度的样本数据。
可选的,在本发明第一方面的第一种实现方式中,历史医疗数据携带有业务标识;根据历史医疗数据和预先设置的标签库,为历史医疗数据设置标签,得到历史医疗数据的初始样本数据的步骤,包括:根据业务标识,对历史医疗数据进行业务分类,将属于相同业务类型的历史医疗数保存至对应的数据存储空间;其中,业务类型至少包括:影像业务,问诊业务,以及病程业务;针对每个数据存储空间,根据数据存储空间中的历史医疗数据和标签库,对历史医疗数据设置对应的标签,得到历史医疗数据的初始样本数据。
可选的,本发明第一方面的第二种实现方式中,数据存储空间包括影像数据存储空间;针对每个数据存储空间,根据数据存储空间中的历史医疗数据和标签库,对历史医疗数据设置对应的标签,得到历史医疗数据的初始样本数据的步骤,包括:针对影像数据存储空间,解析影像数据存储空间中的影像医疗数据的第一医疗信息;根据第一医疗信息和影像医疗数据对应的影像标签库,对影像医疗数据设置第一标签,得到影像医疗数据对应的初始样本数据。
可选的,在本发明第一方面的第三种实现方式中,数据存储空间包括问诊数据存储空间;针对每个数据存储空间,根据数据存储空间中的历史医疗数据和标签库,对历史医疗数据设置对应的标签,得到历史医疗数据的初始样本数据的步骤,包括:针对问诊数据存储空间,解析问诊数据存储空间中的问诊医疗数据的第二医疗信息;根据第二医疗信息和问诊医疗数据对应的问诊标签库,对问诊医疗数据设置第二标签,得到问诊医疗数据对应的初始样本数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于康键信息技术(深圳)有限公司,未经康键信息技术(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210288257.6/2.html,转载请声明来源钻瓜专利网。