[发明专利]基于neighbor2vec的肝癌术后复发风险预测系统在审
申请号: | 202010332427.7 | 申请日: | 2020-04-24 |
公开(公告)号: | CN111524600A | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 陈云亮;曹元奎;李婕;樊俊青;刘传礼;杨红丽;芮法娟;张思敏;李建新 | 申请(专利权)人: | 中国地质大学(武汉) |
主分类号: | G16H50/30 | 分类号: | G16H50/30;G06K9/62 |
代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 杨采良 |
地址: | 430074 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 neighbor2vec 肝癌 术后 复发 风险 预测 系统 | ||
本发明属于医学数据信息处理技术领域,公开了一种基于neighbor2vec的肝癌术后复发风险预测系统,对原发性医学病例数据异常值以及不相关数据进行剔除,对剩余部分缺失值进行填充,并采用相关系数对病例数据集进行特征选择,得到提取后的病例数据特征;采用得到的特征数据以及原始病例数据中的原发性术后复发与否的数据组成样本数据,用原始数据集中每个病例的最近邻居构成的向量表示该病例,形成向量表数据集;按一定比例划分训练集和测试集及训练。本发明提出neighbor2vec的思想,通过利用多个近邻的向量集合来表示单一病例,可以作为预测肝癌术后复发的敏感而稳定的方法,估计肝癌的复发率有助于治疗的分配,最终达到安全的预后。
技术领域
本发明属于医学数据信息处理技术领域,尤其涉及一种基于neighbor2vec的肝癌术后复发风险预测系统。
背景技术
目前,肝癌被认为是继肺癌和胃癌之后的第三大癌症死亡原因,肝细胞癌是肝癌中最常见的恶性肿瘤之一。
目前的指南建议对孤立性肝癌患者首选手术切除。但肝癌术后复发率仍然很高,没有可靠的临床资料为术后患者提供更好的建议。肝癌患者的资料具有以下特点:1)资料非线性,缺失值多;2)特征维数过高;3)各种影响因素对肝癌术后复发预测的相关性较低。
通过上述分析,现有技术存在的问题及缺陷为:(1)传统的线性预测方法不能对非线性数据进行分析,因而对肝癌术后复发风险问题的评估准确度不高。
(2)现有技术大多依赖已有经验,但影响肝癌复发的因素过多,凭靠经验很难对其进行准确的判断。
(3)由于影响肝癌复发的因素过多,且各影响因素对肝癌术后复发预测的相关性较低,现有技术很难从中发现影响因素的组合规律。
(4)存在一些因为复杂的心理变化及病理切缘残留的肝癌复发病例,导致容易出现对单个病例的错误分析。
解决以上问题及缺陷的难度为:如何寻找一种可以处理非线性数据,并且可以从数据中寻找规律,建立关系,对数据的依赖较大,对经验的依赖较小的方法。同时如何避免一些因为复杂的心理变化及病理切缘残留的特殊的肝癌复发病例对正确预测的干扰。
解决以上问题及缺陷的意义为:本发明的方法可以根据患者体检的病理特征,快速准确地帮助医护人员判断肝癌的术后复发风险,有助于治疗的分布,最终达到安全的预后。
发明内容
为了解决现有技术存在的问题,本发明提供了一种基于neighbor2vec的肝癌术后复发风险预测系统。
本发明是这样实现的,一种基于neighbor2vec的肝癌术后复发风险预测系统,包括:
病例数据特征提取模块,对原发性医学病例数据异常值以及不相关数据进行剔除,对剩余部分缺失值进行填充,并采用Pearson相关系数对病例数据集进行特征选择,得到提取后的病例数据特征;
向量表数据集获取模块,采用得到的特征数据以及原始病例数据中的原发性术后复发与否的数据组成样本数据,利用neighbor2vec思想,用原始数据集中每个病例的最近邻居构成的向量表示该病例,形成向量表数据集;
数据训练模块,按一定比例划分训练集和测试集,并采用Naive Bayes预测方法对训练数据进行训练;
数据测试模块,利用测试数据对训练后的Naive Bayes预测方法进行测试。
本发明的另一目的在于提供一种基于neighbor2vec的肝癌术后复发风险预测方法包括以下步骤:
S1对原发性肝癌患者的医学病例数据异常值以及不相关数据进行剔除,对其它部分缺失值进行填充,并采用Pearson相关系数对病例数据集进行特征选择,得到提取后的病例数据特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国地质大学(武汉),未经中国地质大学(武汉)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010332427.7/2.html,转载请声明来源钻瓜专利网。