[发明专利]一种基于特征值进行前列腺癌复发预测的系统和方法在审
申请号: | 201710113827.7 | 申请日: | 2017-02-28 |
公开(公告)号: | CN106778046A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 荣小辉;张洋;高彦回;刘为 | 申请(专利权)人: | 思派(北京)网络科技有限公司 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 北京天达知识产权代理事务所(普通合伙)11386 | 代理人: | 张春,龚颐雯 |
地址: | 100082 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征值 进行 前列腺癌 复发 预测 系统 方法 | ||
技术领域
本发明涉及疾病预测的技术领域,尤其涉及一种基于特征值进行前列腺癌复发预测的系统和方法。
背景技术
目前,正处于大数据时代,各行各业都有大规模的数据量,现有技术中的简单规则处理难以发挥这些数据的价值。硬件的高速发展给大数据的分析和应用提供了条件。高性能计算使得基于大规模数据的数据学习时间和数据处理代价大大降低了;大规模数据存储,使得能够更快、代价更小地处理大规模数据。由于硬件和算法的发展,使得在使用机器学习解决数据分析的问题后,能获得更加丰厚收益。
现有的机器学习技术主要运用到新闻、电子商务等互联网领域,在传统领域,尤其是医学领域的应用十分匮乏。因此,本发明提供一种将机器学习方法运用到医学领域中,进行前列腺癌复发的预测,以弥补现有技术中,前列腺癌复发的预测主要依赖医生的主观判断,判断的准确性取决于医生的主观经验,不同的医生对患者病情的判断结果可能回不一致,这容易导致误诊,甚至可能会延误患者病情的问题。
发明内容
鉴于上述的分析,本发明旨在提供一种基于特征值进行前列腺癌复发预测的系统和方法,用以解决现有方法耗费人力、且依赖医生主观判断,缺乏统一标准,容易造成误诊的问题。
本发明的目的主要是通过以下技术方案实现的:
提供一种基于特征值进行前列腺癌复发预测的系统,包括医生工作站和服务器。
医生工作站用于接收输入信息和显示预测结果。
服务器包括信息获取模块、预处理模块、模型训练模块、信息接收模块、前列腺癌复发预测器。
信息获取模块,用于获取前列腺癌病例的电子数据,从中获得训练集合;
预处理模块,用于提取训练集合中的每个病例的特征信息,对提取的特征信息进行预处理,生成训练用特征词集合,并为集合中的特征词生成对应的特征值,将特征值输入到模型训练模块;预处理模块还用于对用户输入信息进行特征信息提取、预处理和生成特征值的处理,并将该特征值输入到经过训练的前列腺癌复发预测器。
模型训练模块,用于利用特征值训练聚类分析模型,得到前列腺癌复发预测器;
信息接收模块,用于接收用户通过医生工作站输入的信息,并将接收的信息传输到预处理模块;
经过训练的前列腺癌复发预测器根据预处理模块处理用户输入信息得到的特征值,得到前列腺癌复发的预测结果,并输出到医生工作站。
其中,
预处理模块中提取的特征信息包括:前列腺癌的术前psa,术前fpsa,肿瘤级别、淋巴转移、骨转移、评分、是否生化复发。
预处理模块中的预处理包括:对提取的特征信息进行分词;对噪声词进行剔除处理。
进一步的,在分词和噪声词剔除处理之后,还包括对特征词集合中的同义词进行替换。
进一步的,预处理模块还包括对训练用特征词集合中的特征词进行特征选择的过程。
优选的,预处理模块采用Hash算法为特征词生成对应的特征值,或者基于预先建立赋值表给特征词生成对应的特征值。
优选的,系统中的聚类分析模型基于K-means算法。
进一步的,服务器还包括测试模块,用于对经过训练的前列腺癌复发预测器进行测试。在前列腺癌复发预测器的测试结果不理想的情况下,更改聚类分析算法或更改特征选择的数量,以对前列腺癌复发预测器进行调整;基于重新获得的前列腺癌复发预测器,再进行测试;通过不断调整前列腺癌复发预测器,不断重新测试,直到测试结果达标。
本发明还提供一种基于特征值进行前列腺癌复发预测的方法,包括以下步骤:
步骤S1.获取前列腺癌病例的电子数据,从电子数据获得用于预测前列腺癌复发用的训练集合;
步骤S2.提取训练集合中的每个病例的特征信息;
步骤S3.对提取的特征信息进行预处理,生成训练用特征词集合;
步骤S4.为训练用特征词集合中的特征词生成对应的特征值;
步骤S5.利用上一步生成的特征值,训练聚类分析模型,得到前列腺癌复发预测器;
步骤S6.接收用户输入的、对前列腺癌的描述信息;
步骤S7.对用户的输入信息进行特征信息提取、预处理和生成特征值的处理,处理方法同步骤S2~S4,得到待预测信息的特征值;
步骤S8.前列腺癌复发预测器根据待预测信息的特征值,得到前列腺癌复发的预测结果。
本发明有益效果如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思派(北京)网络科技有限公司,未经思派(北京)网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710113827.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:患者信息管理系统
- 下一篇:一种基于多维度医学图像的中医面诊综合系统
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用