[发明专利]一种基于机器学习的肝病认知模型构建方法和系统在审
| 申请号: | 202110092517.8 | 申请日: | 2021-01-24 |
| 公开(公告)号: | CN112768079A | 公开(公告)日: | 2021-05-07 |
| 发明(设计)人: | 杜乐;耿飞;丁华普;张铭威 | 申请(专利权)人: | 武汉东湖大数据交易中心股份有限公司 |
| 主分类号: | G16H50/70 | 分类号: | G16H50/70;G06N20/00 |
| 代理公司: | 武汉蓝宝石专利代理事务所(特殊普通合伙) 42242 | 代理人: | 刘璐 |
| 地址: | 430000 湖北省武汉市东湖新技术开*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 机器 学习 肝病 认知 模型 构建 方法 系统 | ||
本发明涉及一种基于机器学习的肝病认知模型构建方法和系统,包括如下步骤:获取样本人群的性别、年龄、健康状况、肝功能检查项目和相应的生物化学指标数据;根据医学知识库确定不同性别、年龄和健康状况下的生物化学指标数据的基准参考区间以及异常区间,并根据其建立第一数据集;获取所述第一数据集对应的症状的解决方案,并建立其相互匹配的第二数据集;利用第二数据集训练分类模型得到训练好的分类模型;将待测人的生物化学指标数据输入到所述分类模型,得到异常特征值;利用贝叶斯算法预测待测人患有肝病的概率。本发明构建的模型通过机器学习充分挖掘医学知识库与检查项目的关联,提高了肝病知识库的针对性和可读性。
技术领域
本发明属于医学信息及机器学习领域,具体涉及一种基于机器学习的肝病认知模型构建方法和系统。
背景技术
肝病是一种具有危害性大、流行性广泛、治愈率低、死亡率高等特点的传染病。常见的肝病有肝炎、肝硬化、肝脓肿、脂肪性肝病、酒精性肝病、原发性肝癌等。目前常规检查主要依靠肝功能实验室检查。肝功能实验室检查是通过某些生物化学指标检测,间接评估肝脏的代谢功能,为临床医师正确的做出肝胆疾病诊断、鉴别诊断、预后判断、病程检测及疗效观察等,提供有价值的信息。目前肝功能在临床开展的试验种类繁多,不下几十种,但是每一种肝功能试验,只能探查肝脏的某一方面的某一种功能,到现在为止,仍然没有一种试验,能反映肝脏的全部功能。
一方面基层医疗设备设施不健全,无法完全覆盖肝病的全部检查项目;另一方面临床经验的缺乏,无法对一些复杂肝病症状作出正确判断,而现有医学知识库中涉及肝病的知识专业性强、缺乏针对性,参考或查阅不方便。此外,随着生活水平的提高和健康意识的增强,大众也需要一个通俗易懂、简单适用的百科类知识库,提高对肝病的认识和有利于自我筛查,减少对医疗资源的占用。
发明内容
为充分挖掘现有医学知识库与肝病诊断项目的联系,提高肝病知识库的针对性,在本发明的第一方面提供一种基于机器学习的肝病认知模型构建方法,包括如下步骤:获取样本人群的性别、年龄、健康状况、肝功能检查项目和相应的生物化学指标数据;根据医学知识库确定不同性别、年龄和健康状况下的生物化学指标数据的基准参考区间以及异常区间,并根据其建立第一数据集;获取所述第一数据集对应的症状的解决方案,并建立其相互匹配的第二数据集;利用第二数据集训练分类模型,直至其误差低于阈值且趋于稳定,得到训练好的分类模型;
在本发明的一些实施例中,所述获取所述第一数据集对应的症状的解决方案,并建立其相互匹配的第二数据集包括如下步骤:根据所述肝功能检查项目和相应的生物化学指标数据的正常参考区间建立异常数据集合;获取所述第一数据集对应的肝病症状;根据所述肝病症状和医学知识库匹配到相应的解决方案。
在本发明的一些实施例中,所述训练好的分类模型通过以下步骤训练:将所述第二数据集进行标准化、归一化,得到所述第二数据集的第一特征集合;对所述第一特征集合进行去重、合并,得到第二特征集合;利用K邻近算法对所述第二特征集合进行分类,直至误差低于阈值且趋于稳定。
进一步的,所述利用K邻近算法对所述第二特征集合进行分类,直至误差低于阈值且趋于稳定包括步骤:将所述第二特征集合划分为训练集、测试集、验证集;计算测试集中的各个数据与训练集中数据的距离;随机选取测试集中的任一数据作为样本标签,从训练集中选取与样本标签距离最小的K个点;确定所述最小的K个点所在类别的出现频率,将其中出现频率最高的类别作为测试数据的预测分类;遍历所有测试集的数据并重复上述步骤,直至分类误差低于阈值且趋于稳定。
更进一步的,所述计算测试集中的各个数据与训练集中数据的距离采用欧氏距离或曼哈距离进行计算。
在本发明的一些实施例中,所述将待测人的生物化学指标数据输入到所述分类模型,得到异常特征值;利用贝叶斯算法和异常特征值预测待测人患有肝病的概率包括如下步骤:将异常特征值划分为偏高和偏低两类;匹配异常特征值对应的肝病种类,得到候选肝病集合;根据贝叶斯算法计算每种候选肝病条件下及其余候选肝病的概率和;将概率和最大的候选肝病作为待测人患有肝病的预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉东湖大数据交易中心股份有限公司,未经武汉东湖大数据交易中心股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110092517.8/2.html,转载请声明来源钻瓜专利网。





