[发明专利]中医证候的分子解释工具构造方法有效
申请号: | 201310208018.6 | 申请日: | 2013-05-30 |
公开(公告)号: | CN103279666A | 公开(公告)日: | 2013-09-04 |
发明(设计)人: | 高一波;代文;卢朋;刘西;陈琳;宋江龙;陈迪 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 宋焰琴 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 中医 分子 解释 工具 构造 方法 | ||
技术领域
本发明涉及计算机技术在中医领域研究中的应用,特别是涉及基于中医病例样本的中医证候分子解释机制,具体是一种中医证候的分子解释工具构造方法,所述分子解释工具用于从分子层面阐释中医证候的机理。
背景技术
中医的发展源远流长,在一些疾病治疗上逐渐形成一套完善的体系。中医对疾病的诊断建立在一套完备的证候理论之上,基于“望闻问切”四诊信息,在症状群基础之上对患者的中医证候做出经验判断。
“证候”是中医学的专用术语,概括为一系列有相互关联的症状总称;即通过望、闻、问、切四诊所获知的疾病过程中表现在整体层次上的机体反应状态及其运动、变化。证,是指对疾病所处的一定阶段的病机概括,或非疾病机体一定阶段的机体状态的概括;候,是指这种病机或状态的可被观察到的外在表现。
中医体系的形成得益于中医学家长期以来实践与经验的积累。在这个过程中,中医名书古籍记载着中医实践者智慧的结晶,推动者中医学的发展。然而,正是由于中医诊断依赖中医专家的经验,不同医师根据从业经历和业务水平的不同,对同一对象会做出不同的判断,这使得中医的诊断具有一定的主观性。缺乏准确的分子解释,是制约中医发展的一大瓶颈。近年来,一些国内外研究者试图在大量中医病例样本数据的基础上,提取出症状与证候之间的关系,对中医证候的诊断加以量化。
目前,中医证候的研究主要集中在对中医病例样本进行学习,并构建用于证候诊断的分类模型。在学习方法的选择上则不尽相同,有些学习算法得到的模型预测准确度较高,而有的模型则相对较低,比较常见的有如下三类方法用于构建证候诊断模型。第一类方法对病例样本进行回归分析,得到证候的判别函数,表征出不同症状的重要性,并用于新病例的预测。第二类根据相关分析对症状进行打分,然后筛选出预测准确度最高的判别函数作为诊断模型。第三类方法采用机器学习的算法(如贝叶斯网络、支持向量机等)对病例样本进行学习,并构建出最优模型,用于新病例的预测。这三类方法都可以得到较高的准确率,但是同时各有一定的局限性。第一类方法往往是基于大批量的样本数据,在小样本的情况下难以保证高准确率,第二类方法的主观性较大,第三类方法在不平衡样本集上的表现欠佳。尽管中医证候的研究在证候分类上取得了不少进展,但是很少有学者从分子层面对中医证候的潜在机理进行阐述。
针对这种情况,有必要对中医证候建立分子解释机制,并构建一系列分子解释工具,利用分子解释工具不仅能根据中医病例样本筛选核心症状,还能对核心症状的分子机制进行分析,从而更好的阐释中医证候的机理。
发明内容
(一)要解决的技术问题
本发明所要解决的技术问题在于提供一种构造基于中医病例样本的中医证候分子解释工具,以便方便地对中医症候的核心症状的分子机制进行阐释。
(二)技术方案
为解决上述技术问题,本发明提出一种中医证候分子解释工具构造方法,以便于从分子层面阐释中医证候的机理,所述方法包括如下步骤:步骤S1:根据中医病例样本数据,计算症状与中医证候之间的信息增益;步骤S2:根据多个不同的信息增益阈值来筛选出多个不同的症状集,并构建基于该多个不同症状集的支持向量机分类模型;步骤S3:将所述多组支持向量机模型中的预测准确率最高的一组支持向量机分类模型对应的症状集作为核心症状;步骤S4:确定所述核心症状对应的表型本体条目以及表型本体条目关联的基因,依据关联基因的出现频率对基因进行排序,并设置一个频率阈值来筛选出频繁基因;步骤S5:根据所述筛选得到的频繁基因和生物通路图数据来构造用于中医证候解释的分子解释工具。
根据本发明的具体实施方式,在步骤S1中,信息增益IG(C|X)根据下面的表达式来计算:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310208018.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种恶性肿瘤放化疗规范符合度的量化评估系统
- 下一篇:一种小儿消肿镇痛外敷膏
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用