[发明专利]用于随机森林中的自举汇聚的基于泊松分布的方法在审
申请号: | 202011023621.3 | 申请日: | 2020-09-25 |
公开(公告)号: | CN112990474A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | M·阿维布赫;M·R·哈格海特 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06K9/62 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 黄嵩泉;何焜 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 随机 森林 中的 汇聚 基于 分布 方法 | ||
本文公开了用于随机森林中的自举汇聚的基于泊松分布的方法。系统、设备和方法可以提供用于根据泊松分布生成包含数据的技术,其中包含数据指定观察集合中的每个观察的包含数量。该技术还可以至少部分地基于包含数据来训练随机森林中的第一决策树。
技术领域
实施例大体上涉及机器学习决策树。更具体地,实施例涉及随机森林中的自举汇聚(bootstrap aggregation)的基于泊松分布的方法。
背景技术
机器学习技术可用于执行自动化分类(例如,在对象识别和/或自然语言处理/NLP应用中)、回归分析(例如,在标识因变量与一个或多个自变量之间的关系的应用中)、等等。例如,机器学习实现可包括决策树集合,这些决策树可以被训练成用于在决策树的每个节点处二元地分割观察数据。“随机森林”可以在训练期间随机且均匀的采样(例如,在替换的情况下)用于森林中每个决策树的观察数据。此类对观察数据进行采样的方法可能导致在大多数硬件平台上低效的存储器访问模式。因此,可能对性能、功耗和/或电池寿命造成负面影响。
附图说明
通过阅读以下说明书和所附权利要求并通过参考以下附图,实施例的各种优势对本领域技术人员将变得显而易见,其中:
图1是常规存储器访问模式和根据实施例的存储器访问模式的示例的比较图示;
图2是根据实施例的操作性能增强的计算系统的方法的示例的流程图;
图3是根据实施例的训练决策树的方法的示例的流程图;
图4是根据实施例的训练随机森林的方法的示例的流程图;
图5是根据实施例的训练决策树的更详细的方法的示例的流程图;
图6是根据实施例的软件栈的示例的框图;
图7是根据实施例的性能增强的计算系统的示例的框图;
图8是根据实施例的半导体装置的示例的图示;
图9是根据实施例的处理器的示例的框图;以及
图10是根据实施例的基于多处理器的计算系统的示例的框图。
具体实施方式
现在转到图1,示出了常规存储器访问模式20,其中第一索引集合22与第一树(“编号为0的树”)相关联而第二索引集合24与第k树(“编号为k的树”)相关联。第一树和第二树可以是随机森林中的决策树,该随机森林被训练以执行自动化分类、回归分析等。在所图示的示例中,从对应于观察集合26(26a-26N)的索引中随机且均匀地采样第一索引集合22。观察集合26中的每个观察通常可以包括特征值,诸如例如,[特征:颜色,值:绿色]、[特征:像素位置,值:xi,yi]等。类似地,可以从对应于观察集合26的索引中随机且均匀地采样第二索引集合24。
在所图示的示例中,在自举汇聚过程期间使用索引集合22、24来从观察集合26中检取数据以用于训练目的。因此,所图示的常规访问模式20在性质上是随机的。特别要注意的是,从诸如高速缓存存储器、高速缓存控制器、系统存储器、存储器控制器等之类的硬件组件的角度来看,常规访问模式20的随机性质可能是低效的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011023621.3/2.html,转载请声明来源钻瓜专利网。