[发明专利]基于密度诱导1类支持向量机的医疗诊断方法及系统在审
申请号: | 201410053830.0 | 申请日: | 2014-02-18 |
公开(公告)号: | CN103761445A | 公开(公告)日: | 2014-04-30 |
发明(设计)人: | 张莉;周伟达;何书萍;王邦军;张海飞;李凡长 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 常亮 |
地址: | 215123 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 密度 诱导 支持 向量 医疗 诊断 方法 系统 | ||
技术领域
本申请涉及医疗诊断领域,更具体地说,涉及一种基于密度诱导1类支持向量机的医疗诊断方法及系统。
背景技术
传统的医疗诊断是通过医生根据临床经验,对病人进行推理诊断的决策过程。这种决策的正确性完全取决于医生的个人经验,显然传统的这种医疗诊断方法不能够满足现代社会发展的要求。
在现代社会计算机广泛普及的情况下,很多传统的任务都能够采用智能化的手段来处理。智能的医疗诊断过程将比传统的医疗诊断提供更为客观和准确的决策。目前,很多机器学习方法都应用到了医疗诊断中,比如K近邻方法、支持向量机、神经网络等。但是,由于医疗数据是非常不平衡的数据,其正常数据多,非正常数据少,非正常数据反映的是某人是某种疾病的携带者,因而常规的机器学习分类方法不能够获得较好的分类结果。
发明内容
有鉴于此,本申请提供了一种基于密度诱导1类支持向量机的医疗诊断方法及系统,用于解决现有机器学习分类方法针对不平衡的医疗数据,无法有效的进行正确分类的问题。
为了实现上述目的,现提出的方案如下:
一种基于密度诱导1类支持向量机的医疗诊断方法,包括:
计算多个已知数据类型的训练样本的相对密度;
由所述训练样本、与每个所述训练样本对应的数据类型和每个所述训练样本的相对密度,构成三元训练样本集;
利用所述三元训练样本集来训练密度诱导1类支持向量机,获得一个已知半径的超球体模型;
获取待测医疗诊断数据;
将所述待测医疗诊断数据代入所述超球体模型中,判断所述待测医疗诊断数据所代表的点是否位于所述超球体模型内,如果是,则表示该待测医疗诊断数据的数据类型为正常,否则表示数据类型为异常。
优选地,所述多个已知数据类型的训练样本表示为:
其中xi∈RD,yi∈(+1,-1),N是训练样本的个数,D是训练样本的维数,yi代表训练样本xi的数据类型,若yi=1表示xi为正常数据,若yi=-1表示xi为异常数据。
优选地,所述计算多个已知数据类型的训练样本的相对密度,具体为:
对xi寻找其k个近邻,令xi与第k个近邻的距离为则该训练样本的相对密度为:
优选地,所述三元训练样本集为:
优选地,所述利用所述三元训练样本集来训练密度诱导1类支持向量机,获得一个已知半径的超球体模型,具体为:
利用所述三元训练样本集,求解下面的二次优化问题:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410053830.0/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用