[发明专利]改进的偏最小二乘回归法在微生物培养基优化中的应用方法有效
申请号: | 201810407924.1 | 申请日: | 2018-04-26 |
公开(公告)号: | CN108664719B | 公开(公告)日: | 2022-01-04 |
发明(设计)人: | 赵文慧;赵长虹;朱新术;周晨妍;张文博;蔡刘滕 | 申请(专利权)人: | 新乡医学院 |
主分类号: | G16B5/20 | 分类号: | G16B5/20;G16B40/00;G06N3/12 |
代理公司: | 西安研创天下知识产权代理事务所(普通合伙) 61239 | 代理人: | 张红哲 |
地址: | 453003 *** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种改进的偏最小二乘回归法在微生物培养基优化中的应用,整合交叉验证和变量筛选的技术以降低PLSR潜在的过拟合问题,即首先通过留一法交叉验证提取合适数目的潜变量,然后利用基于变量投影重要性技术的变量筛选方法并结合回归模型决定系数的稳健准则建立简约,稳健,特别是预测精度高的模型。本发明提出的VIP回归模型建立简约,稳健和预测精度高的模型的有效性。可以进一步推广。 | ||
搜索关键词: | 改进 最小 回归 微生物 培养基 优化 中的 应用 方法 | ||
【主权项】:
1.一种改进的偏最小二乘回归法在微生物培养基优化中的应用,其特征在于,包括以下步骤:步骤1.培养基配方基于均匀设计进行设计与配置,并接种热纤梭菌进行培养,然后分别测定生物量OD600、二糖消耗量、乙醇浓度、乙酸浓度和酸度下降值,并均作为发酵响应;用二次多项式表征培养基均匀设计配比和发酵响应之间的数学关系,并用皮尔逊相关系数法分析培养基配比和发酵响应组合矩阵的相关系数;步骤2.在步骤1中均匀设计实验数据为基础,通过计算交叉验证的R2数值
筛选合适的潜变量个数,具体公式如下:
其中PRESS(h)是响应向量提取h个潜变量时的预测残差平方和;SS(h‑1)是响应向量提取h‑1个潜变量的均方误差和;PRESS(h)和SS(h)的计算公式分别为,
和
其中yi为因变量原始数值;yhi是利用所有样本点提取主成分数目分别为t1,t2...th时进行回归拟合的i个样本点的拟合值;yh(‑i)表示剔除i个样本点的建模拟合情况;步骤3.在步骤2确定提取潜变量的最佳数目之后,建立包含所有预测变量的全模型PLSR模型,并给出相应的二次多项式回归方程和对应的决定系数R2;步骤4.利用VIP技术评估原始预测变量对因变量向量的重要程度;VIP数值的计算公式如下:
其中p为预测变量数目;th为预测变量矩阵X提取的第h个潜变量;r(y,th)为响应变量和潜变量间的相关系数,表示潜变量对响应变量的解释能力;
为预测变量j对潜变量的权重值,当VIP=0.8表示预测变量对响应变量具有显著作用的阈值;由此建立预测变量矩阵对响应向量的VIP矩阵;步骤5.创建改进的PLSR模型以减小全模型潜在的过拟合风险;主要是整合VIP变量筛选技术和稳健的判定系数准则,即利用步骤4中筛选的显著性预测变量,VIP≥0.8,作为新的输入预测变量,对响应向量进行新一轮的PLSR建模,反复循环该过程,直到模型中所有的预测变量都是显著变量;然而,变量选择的一般准则是模型决定系数会随着冗余变量剔除的增加而降低,这将降低模型的拟合精度,甚至影响预测精度,所有必须做出权衡:即预测变量筛选过程在相应的VIP数值≥0.8且不严重破坏PLSR模型稳健性的情况下停止;建立相应的VIP‑PLSR模型,给出对应的决定系数R2,并建立相应预测变量对响应向量的VIP矩阵;并绘图比较PLSR全模型和VIP模型拟合的相对误差;步骤6.模型的求解与验证;利用遗传算法对生物量、乙酸浓度、乳酸浓度和乙醇浓度的PLSR全模型和VIP模型的二次多项式进行求解,得出相应的最优解和最优值,分别在各自培养基最佳预测配比条件下,测定相应的响应向量,并考察两种模型预测值与实验值的相对误差,考察两种模型的预测精度,确定VIP模型对全模型过拟合风险的降低程度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新乡医学院,未经新乡医学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810407924.1/,转载请声明来源钻瓜专利网。