[发明专利]基于肠道菌群丰度的分类器建模评价校验方法及系统有效
申请号: | 201710648124.4 | 申请日: | 2017-08-01 |
公开(公告)号: | CN107480474B | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 刘弘;赵丹丹;郑元杰;何演林;陆佃杰;吕晨 | 申请(专利权)人: | 山东师范大学 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G06K9/62;G06N3/08 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 张勇 |
地址: | 250014 *** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及基于肠道菌群丰度的分类器建模评价校验方法及系统,该方法包括:分别获取健康人群和结直肠癌患者的年龄、性别、肥胖指数以及肠道菌群的DNA序列,将获取的肠道菌群的DNA序列进行质量控制,并获取肠道菌群的DNA序列中的肠道菌群丰度,构建样本集;将样本集划分为训练样本集和测试样本集,分别运用支持向量机和人工神经网络进行训练和预测,并分别选取支持向量机和人工神经网络的预测结果的部分样本作为训练集,其余作为测试集重新返回到支持向量机模型中得出最后的分类预测结果,构建出分类器模型;根据评价指标评价构建出的分类器模型,并选用检验方法对构建出的分类器模型进行校验,评价指标包括:敏感性、特异性和精确度。 | ||
搜索关键词: | 基于 肠道 菌群丰度 分类 建模 评价 校验 方法 系统 | ||
【主权项】:
1.一种基于肠道菌群丰度的分类器建模评价校验方法,其特征是:该方法包括:(1)分别获取健康人群和结直肠癌患者的年龄、性别、肥胖指数以及肠道菌群的DNA序列,将获取的肠道菌群的DNA序列进行质量控制,并获取肠道菌群的DNA序列中的肠道菌群丰度,构建样本集;(2)将样本集划分为训练样本集和测试样本集,分别运用支持向量机和人工神经网络进行训练和预测,并分别选取支持向量机和人工神经网络的预测结果的部分样本作为训练集,其余作为测试集重新返回到支持向量机模型中得出最后的分类预测结果,构建出分类器模型;(3)根据评价指标评价构建出的分类器模型,并选用检验方法对构建出的分类器模型进行校验,评价指标包括:敏感性、特异性和精确度;所述步骤(1)中,获取肠道菌群的DNA序列中的肠道菌群丰度包括:分别从界、门、纲、目、科、属、种七种水平上对各种肠道菌群的含量进行分析,获取肠道菌群的DNA序列中的肠道菌群丰度;构建的样本集中每个样本均包括:年龄、性别、肥胖指数、肠道菌群丰度和样本所属人群,所述样本所属人群包括健康人群和结直肠癌患者人群;所述步骤(2)的具体步骤为:(2‑1)将样本集划分为训练样本集和测试样本集,样本集的三分之二样本数据设置为训练样本集,样本集的剩余三分之一数据设置为测试样本集,训练样本集和测试样本集输入支持向量机模型进行训练和预测得到第一预测结果,同时训练样本集和测试样本集输入人工神经网络模型进行训练和预测得到第二预测结果;在步骤(2)中,建立支持向量机与人工神经网络预测模型,分别对模型参数进行优化,判断模型是否为最优,若是将预测结果作为支持向量机的输入重新训练测试,若否,返回继续优化参数;(2‑2)分别从第一预测结果和第二预测结果中选取部分样本作为训练集,第一预测结果和第二预测结果中剩余样本作为测试集,将训练集和测试集输入支持向量机进行再次训练和预测,得出最后的分类预测结果,构建出分类器模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710648124.4/,转载请声明来源钻瓜专利网。