[发明专利]一种分布式SVM优化方法及系统在审
申请号: | 201710999243.4 | 申请日: | 2017-10-20 |
公开(公告)号: | CN107832358A | 公开(公告)日: | 2018-03-23 |
发明(设计)人: | 刘小东;蒋杰 | 申请(专利权)人: | 上海爱优威软件开发有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 201203 上海市浦东新区中国(上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分布式 svm 优化 方法 系统 | ||
技术领域
本申请涉及智能终端技术领域,尤其涉及分布式SVM方法及系统。
背景技术
随着移动互联网、移动终端和数据传感器的发展,数据以超出想象的速度发生爆发式的增长。在未来一段时间内,大数据将成为企业、社会和国家层面重要的战略资源。进入大数据时代,从大数据中获取有用的价值并挖掘隐藏的数据规律作为重要课题,针对海量数据如何进行分类,存储,管理,分析等成为了关键问题。为了解决上述问题,Google提出了Google FileSystem架构用于存储管理大型文件;MapReduce架构用于分析处理文件数据,BigTable用于管理各种书;Apache推出了Hadoop大数据开发平台。支持向量机SVM(Support Vector Machines)是小规模数据挖掘算法中最有效的方法之一,SVM可支持线性模型及非线性模型的数据挖掘。但是,传统的SVM方法只适用于小规模的数据挖掘数量,难点在于如何将SVM的优良特性适用于大规模数据。
其中,随着Google MapReduce并行处理模型的推出,SVM可以通过将训练样本进行均匀随机的切分,然后对子样本集进行训练,并结合子样本集以获取最终的支持向量机。然而,该模型受限于线性模型以及集合数据的特殊性,并且过多的划分子集模块,导致训练的准确率降低。
因此,期望提供一种分布式SVM优化方法及系统,基于Tensor Flow平台,划分子集进行分布式SVM训练,再输出训练的SVM,保证预测精度,提高训练效率。
发明内容
根据本申请的一些实施例的第一方面,提供了一种分布式SVM优化方法,应用于终端(例如,电子设备等)中,所述方法可以包括:获取样本数据集;基于Tensor Flow平台执行迭代;划分子集进行分布式SVM训练,合并得到数据集CXn;判断CXn/CXn-1的比值P是否大于阈值;若是,判断迭代是否结束;若是,输出训练的SVM。
在一些实施例中,所述方法可以进一步包括:若CXn/CXn-1的比值P小于阈值,划分子集进行分布式SVM训练,合并得到数据集CXn。
在一些实施例中,所述方法可以进一步包括:若迭代未结束,基于Tensor Flow平台执行迭代。
在一些实施例中,所述划分子集进行分布式SVM训练进一步包括:基于Tensor Flow平台,将样本数据集划分为M块子集,TX;对所述M块TX子集进行SVM训练。
在一些实施例中,所述合并得到数据集CXn进一步包括:合并TX的SVM集合,得到CX1。
在一些实施例中,所述方法可以进一步包括:将CX1划分为M块子集,CTX;对所述M块子集进行SVM训练;合并CTX的SVM集合,得到CX2。
在一些实施例中,所述判断CXn/CXn-1的比值P是否大于阈值进一步包括:判断CX2/CX1的比值是否大于阈值。
在一些实施例中,所述划分子集进行分布式SVM训练为均匀划分M块子集。
在一些实施例中,所述M块子集为六块子集。
根据本申请的一些实施例的第二方面,提供了一个系统,包括:一个存储器,被配置为存储数据及指令;一个与存储器建立通信的处理器,其中,当执行存储器中的指令时,所述处理器被配置为:获取样本数据集;基于Tensor Flow平台执行迭代;划分子集进行分布式SVM训练,合并得到数据集CXn;判断CXn/CXn-1的比值P是否大于阈值;若是,判断迭代是否结束;若是,输出训练的SVM。
因此,根据本申请的一些实施例的分布式SVM优化方法及系统,基于Tensor Flow平台,划分子集进行分布式SVM训练,再输出训练的SVM,保证预测精度,提高训练效率。
附图说明
为更好地理解并阐述本申请的一些实施例,以下将结合附图参考实施例的描述,在这些附图中,同样的数字编号在附图中指示相应的部分。
图1是根据本申请的一些实施例提供的网络环境系统的示例性示意图。
图2是根据本申请的一些实施例提供的电子设备功能配置的示例性单元示意图。
图3是根据本申请的一些实施例提供的分布式SVM优化方法的示例性流程图。
图4是根据本申请的一些实施例提供的分布式SVM训练方法的示例性流程图。
图5是根据本申请的一些实施例提供的Tensor Flow平台的编码流程的示例性示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海爱优威软件开发有限公司,未经上海爱优威软件开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710999243.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于快递柜的寄件码分配方法及其系统
- 下一篇:一种图片检索方法及系统