[发明专利]从分布式数据学习有效
| 申请号: | 201680009815.3 | 申请日: | 2016-02-12 |
| 公开(公告)号: | CN107430610B | 公开(公告)日: | 2021-08-03 |
| 发明(设计)人: | R·诺克;G·派特锐尼 | 申请(专利权)人: | 澳大利亚国家ICT有限公司 |
| 主分类号: | G06F16/27 | 分类号: | G06F16/27;G06F16/28;G06K9/62 |
| 代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 魏小薇 |
| 地址: | 澳大利亚*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 分布式 数据 学习 | ||
1.一种用于从多个第一数据样本确定多个第一训练样本的计算机实现的方法,所述多个第一数据样本中的每一个包括多个第一特征值和对该第一数据样本进行分类的第一标签,所述方法包括:
通过以下方式确定所述多个第一训练样本中的每一个:
选择所述多个第一数据样本的第一子集,使得第一子集包括具有所述多个第一特征值中的对应的一个或多个第一特征值的数据样本,并且
基于第一子集的第一数据样本中的每一个的第一标签,确定第一子集的所述数据样本的第一特征值之和,
其中确定所述第一特征值之和包括确定基于第一数据样本中的每一个的第一标签进行加权的加权和。
2.根据权利要求1所述的方法,其中
所述多个第一数据样本是第一数据集的数据样本,并且
所述多个第一特征值中的所述对应的一个或多个第一特征值也是第二数据集的多个第二数据样本的第二子集的对应的特征值。
3.根据权利要求1或2所述的方法,还包括:
组合所述多个第一训练样本中的两个或更多个第一训练样本,以由此确定组合的训练样本。
4.根据权利要求3所述的方法,其中组合所述多个第一训练样本中的两个或更多个第一训练样本包括将所述多个第一训练样本中的所述两个或更多个第一训练样本加起来。
5.根据权利要求1或2所述的方法,其中选择第一子集包括选择所述多个第一数据样本中的具有所述多个特征值中的对应的一个或多个特征值的全部第一数据样本。
6.根据权利要求1或2所述的方法,其中选择所述多个第一数据样本的第一子集包括选择所述多个第一数据样本的第一子集,以使得第一子集包括具有所述多个第一特征值中的对应的两个或更多个第一特征值的数据样本。
7.根据权利要求1或2所述的方法,其中选择所述多个第一数据样本的第一子集包括选择所述多个第一数据样本的第一子集,以使得第一标签对于所述多个第一数据样本的第一子集是一致的。
8.根据权利要求1或2所述的方法,其中第一训练样本的特征的特征值是所述数据样本的该特征的第一特征值之和。
9.根据权利要求1或2所述的方法,其中
第一数据样本具有带符号的实数值作为第一特征值,并且第一标签是“-1”和“+1”之一。
10.根据权利要求1或2所述的方法,其中选择第一子集包括选择第一子集,以使得第一子集仅包括具有所述多个第一特征值中的一致的一个或多个第一特征值的数据样本。
11.一种用于融合第一训练数据集和第二训练数据集的方法,所述方法包括:
为第一训练数据集执行根据权利要求1到10中的任一项所述的方法以确定多个第一训练样本;
为第二训练数据集执行根据权利要求1到10中的任一项所述的方法以确定多个第二训练样本;以及
将所述多个第一训练样本中的每一个与所述多个第二训练样本中的基于与该第一训练样本相同的一致特征值的一个第二训练样本合并。
12.根据权利要求11所述的方法,其中将所述多个第一训练样本中的每一个第一训练样本与所述多个第二训练样本中的一个第二训练样本合并包括确定第三训练样本,第三训练样本包括:
所述一个或多个一致特征值;
第一训练样本的除所述对应的一个或多个特征值之外的第一特征值,以及
所述多个第二训练样本中的所述一个第二训练样本的除所述对应的一个或多个特征值之外的第二特征值。
13.一种程序存储器,其上存储有指令,所述指令当被执行时,使处理器执行根据权利要求1-12中的任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于澳大利亚国家ICT有限公司,未经澳大利亚国家ICT有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680009815.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:针对企业环境的浏览器新标签页的生成
- 下一篇:过滤数据沿袭图
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





