[发明专利]通过并行评估分类器输出校正第一分类器中的误差有效
| 申请号: | 201880004476.9 | 申请日: | 2018-03-27 |
| 公开(公告)号: | CN109964278B | 公开(公告)日: | 2023-06-27 |
| 发明(设计)人: | A·S·海菲兹;I·瓦拉赫;K·阮 | 申请(专利权)人: | 艾腾怀斯股份有限公司 |
| 主分类号: | G16B40/00 | 分类号: | G16B40/00;G16C20/70;G06F18/2411;G06F18/27;G06N3/0464;G06N3/09 |
| 代理公司: | 深圳市百瑞专利商标事务所(普通合伙) 44240 | 代理人: | 金辉 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 通过 并行 评估 分类 输出 校正 第一 中的 误差 | ||
提供了用于对测试对象进行分类的系统和方法。对于多个目标对象中的每个相应目标对象执行第一过程,该第一过程包括:(a)将所述测试对象贴靠相应的目标摆放,从而获得所述测试与所述目标之间的相互作用,以及(b)使用第一分类器对所述相互作用进行评分。跨所述多个目标的每个这样的分数形成了测试向量,所述测试向量被输入到第二分类器中,从而获得目标对象的指示。所述第二分类器在训练向量上训练,每个训练向量都是在根据所述第一过程输入多个训练对象中的对应训练对象之后来自所述第一分类器的示例的输出。所述训练对象的一个子集中的每个对象都与所述目标之一唯一地相关联。所述训练对象的另一个子集与所述目标无关。
相关申请的交叉引用
本申请要求2017年3月30日提交的名称为“Systems and Methods forCorrecting Error in a First Classifier by Evaluating Classifier Output inParallel”的美国申请号15/473,980的优先权,该申请据此以引用方式并入。
技术领域
以下内容整体涉及通过以并行方式评估来自分类器的连续输出而校正分类器的误差(诸如偏差),其中分类器的任务是对测试对象进行分类。
背景技术
分类器的应用(诸如深度学习技术)可以用于由大量数据产生相关的见解。正在对分类器跨多个领域的用途加以探索。具体地讲,在医疗保健方面,2009年的美国复苏与再投资法案(American Recovery and Reinvestment Act)和2015年的精准医疗计划(Precision Medicine Initiative)已广泛认可医疗数据在医疗保健领域的价值。由于有几项此类举措的推动,预期到2020年医疗大数据将增长约50倍,达到25,000PB。参见RootsAnalysis在2017年2月22日发表的“Deep Learning in Drug Discovery andDiagnostics,2017-2035”,这篇文章可以在互联网上获得,网址为rootsanalysis.com。
分类器可以用于使用常规的数据挖掘技术产生有价值/有意义的见解。应用的实例包括:药物研发中先导化合物的识别与最优化、对临床试验的患者招募提供支持、医学图像分析、生物标志物识别、药物功效分析、药物依从性评估、测序数据分析、虚拟筛选、分子谱分析、代谢组学数据分析、EMR分析和医疗装置数据评估、脱靶副作用预测、毒性预测、效价优化、老药新用、耐药性预测、个性化药物、药物试验设计、农业化学设计、材料科学与模拟,目前正在这些应用中探索分类器的用途,诸如基于深度学习的解决方案。
在上面提到的领域中使用基于分类器的解决方案可能带来的好处估计价值数十亿美元。例如,众所周知的示例是,深度学习模型已加快了药物研发过程,并且已为精准医疗提供了多项解决方案。随着分类器在老药新用和临床前研究方面得到应用,分类器势必有大好的机会应用于药物研发中。在诊断中,基于分类器提高诊断速度很可能在患医比大的地区产生深远的影响。实施此类解决方案将提高医生的效率,从而减轻不堪重负的全球医疗保健系统的负担。
分类器的一个缺点是存在误差。分类器误差的两个主要来源是偏差和方差。偏差引起的误差被视为分类器的预期(或平均)预测值与该分类器试图预测的正确值之间的差值。由于在应用中通常只使用一个分类器,所以该分类器的预期或平均预测值的概念是与直觉相反的。但如果要不止一次重复分类器训练过程,每次都使用新的训练数据,并且要运行新的分析来创建新的分类器,则由于基础数据集中的随机性,得到的分类器将具有一系列预测值。偏差衡量这些分类器的预测值与正确值大体上的距离。例如,使用电话簿来选择用于训练分类器的调查中的参与者是偏差的一个来源。由于仅调查了某些类别的人员(那些拥有已注册电话号码的人员),所以如果我们重复进行构建整个分类器的练习,则该行为会以一种可能始终不变的方式使结果发生偏斜。类似地,没有跟进调查对象是偏差的另一个来源,原因是该行为持续不断地改变所获得响应的混合体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于艾腾怀斯股份有限公司,未经艾腾怀斯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880004476.9/2.html,转载请声明来源钻瓜专利网。





