[发明专利]数据处理方法和装置在审
申请号: | 201911336654.0 | 申请日: | 2019-12-23 |
公开(公告)号: | CN111178488A | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 范慧婷;卢亿雷 | 申请(专利权)人: | 恩亿科(北京)数据科技有限公司 |
主分类号: | G06N3/00 | 分类号: | G06N3/00 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 张建秀;栗若木 |
地址: | 100080 北京市海淀区西小口路66*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 | ||
本申请实施例公开了一种数据处理方法和装置。所述方法包括:获取需要调整的m个参数对应的初始化种群,其中所述初始化种群包括λ个个体,每个个体包括m个参数对应的初始值,其中m为正整数;对所述初始化种群进行迭代处理,得到λ个最优个体;计算所述最优个体的变异概率;根据所述变异概率,对至少一个最优个体中至少一个参数执行变异操作,得到变异操作所产生的新的种群;从变异操作所产生的新的种群中,选择一个符合预设的最优选择策略个体,确定m个参数对应的参数值。
技术领域
本申请实施例涉及信息处理领域,尤指一种数据处理方法和装置。
背景技术
机器学习算法往往是为了解决某一问题而针对收集到的样本数据进行建模,发现数据中的规律。需要解决的问题往往没有精确解,一般需要转为最优化问题,不断逼近最优解。模型的性能往往是跟模型的参数紧密相关的,即是否能更好地解决提出的问题需要高效、准确地调整模型的参数。其中,参数是机器学习中的算法参数一般分为模型参数和模型超参数,是算法的关键。模型参数是根据数据来学习得到,不需要手动设置,比如支持向量机模型里的支持向量或者逻辑回归中的系数等。而模型超参数是需要模型使用者的手动配置的,比如决策树中每个节点需要使用的特征的比例。
针对模型的超参数,在相关技术中,参数调整的方法主要是手动调整和自动调整。手动调整参数主要是根据模型的使用经验来决定参数如何变化以使得模型评估指标更高或者更低,需要模型使用者有较好的相关专业知识和较多的实践经验,否则效率会很低,耗费的时间成本会随着模型超参数的个数增多而升高。为了解决手动调参的以上缺点,自动调参算法被提出了,主要有搜索算法和贝叶斯优化算法。搜索算法为了得到模型目标函数的全局最优值,自动遍历每个参数的取值空间,获得最优化目标函数的取值点,但是搜索代价很大,很难高效率和高精度地逼近最优解。贝叶斯优化算法通过学习目标函数的先验只是,并且将其与样本的信息融合,利用贝叶斯公式求得目标函数的后验信息,就可以推断该函数在参数空间内何处可以得到最优解。贝叶斯优化算法需要假设模型的优化函数时服从高斯分布的,这极大的限制了该方法的普适性。
因此,如何高效准确地完成参数的调整是亟待解决的问题。
发明内容
为了解决上述任一技术问题,本申请实施例提供了一种数据处理方法和装置。
为了达到本申请实施例目的,本申请实施例提供了一种数据处理方法,包括:
获取需要调整的m个参数对应的初始化种群,其中所述初始化种群包括λ个个体,每个个体包括m个参数对应的初始值,其中m为正整数;
对所述初始化种群进行迭代处理,得到λ个最优个体;
计算所述最优个体的变异概率;
根据所述变异概率,对至少一个最优个体中至少一个参数执行变异操作,得到变异操作所产生的新的种群;
从变异操作所产生的新的种群中,选择一个符合预设的最优选择策略个体,确定m个参数对应的参数值。
在一个示例性实施例中,通过如下方式获取一个个体中m个参数对应的初始值,包括:
获取参数pi的取值空间[ai,bi],其中i为大于等于1,且小于等于m的整数,ai,bi为实数;
对取值空间[ai,bi]等宽划分,得到个初始的取值区间,其中为
从参数pi的个取值区间中选择一个取值区间,并从该取值区间选择一个数值作为该参数pi对应的初始值。
在一个示例性实施例中,所述对所述初始化种群进行迭代处理,得到λ个最优个体,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于恩亿科(北京)数据科技有限公司,未经恩亿科(北京)数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911336654.0/2.html,转载请声明来源钻瓜专利网。