[发明专利]基于改进蚁狮优化算法的虚拟样本生成方法在审
| 申请号: | 202011565995.8 | 申请日: | 2020-12-25 |
| 公开(公告)号: | CN112686361A | 公开(公告)日: | 2021-04-20 |
| 发明(设计)人: | 贾云飞;王栋铭;张显程;张勇;涂善东 | 申请(专利权)人: | 华东理工大学 |
| 主分类号: | G06N3/00 | 分类号: | G06N3/00 |
| 代理公司: | 上海智信专利代理有限公司 31002 | 代理人: | 邓琪 |
| 地址: | 200237 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 改进 优化 算法 虚拟 样本 生成 方法 | ||
本发明提供基于改进蚁狮优化算法的虚拟样本生成方法,包括:根据整体趋势扩散技术确定生成的虚拟样本的下边界和上边界;通过试参法确定ELM模型的隐含层的神经元个数,使ELM模型预测的平均绝对百分比误差小于10%;通过引入蚁狮主动高斯变异、自适应游走边界机制对蚁狮优化算法进行改进,通过改进的蚁狮优化算法,随机选定真实样本,并围绕其生成若干个虚拟样本。本发明的虚拟样本生成方法弥补了传统机器学习模型在处理小样本问题时预测精度不高的不足,并可充分利用改进后的蚁狮优化算法的优势,生成可靠性更高的虚拟样本,扩大原始数据训练集,具有误差小、适用性强、精确度高的优点。
技术领域
本发明涉及一种基于改进蚁狮优化算法的虚拟样本生成方法,属于机器学习小样本问题研究领域。
背景技术
预测复杂系统的未来状态和设计此类系统是非常昂贵、耗时和计算密集的。为了克服这些复杂性和节省大量的成本、时间和能量,可以利用建模。随着数据驱动建模方法在许多领域被广泛应用于建立预测模型,人们提出了许多算法来利用从特定领域收集的结构化数据集来学习数据趋势。这类算法依赖于数据,即充分的数据是保证模型在分类和回归应用中更精确的必要条件。有效数据越多,模型的预测精度就越高。
但在现实世界中,由于成本高、耗时长和计算密集,数据收集过程具有一定的挑战性。因此,建立精确模型所需的数据量通常是有限的。基于小样本数据的系统辨识、决策和预测降低了产量,增加了生产成本,降低了企业的竞争力。尽管大数据时代已经来临,但由于工作和时间的高消耗,特别是在工业生产过程的早期,样品数量仍然有限。小样本问题引起了科学界和工业界的广泛关注。解决小样本集问题仍然是一个长期的挑战。
发明内容
本发明的目的在于提供一种基于改进蚁狮优化算法的虚拟样本生成方法,从而以更小的误差生成虚拟样本,提高基于小样本数据集的预测模型的精度。
为了实现上述目的,本发明提供了一种基于改进蚁狮优化算法的虚拟样本生成方法,包括:
S1:根据整体趋势扩散技术,确定生成的虚拟样本的下边界和上边界;
S2:提供ELM模型,通过试参法确定其隐含层的神经元个数,以使ELM模型预测的平均绝对百分比误差小于10%,并将训练好的ELM模型保存;
S3:通过引入蚁狮主动高斯变异、自适应游走边界机制对蚁狮优化算法进行改进,通过改进的蚁狮优化算法,随机选定一个真实样本,并围绕其生成一个虚拟样本。
在所述步骤S1中,根据真实样本的输入参数来确定真实样本的输入参数的中间位置,进而确定生成的虚拟样本的下边界和上边界;
其中,真实样本的输入参数的中间位置为:
其中,xi为第i个真实样本的输入参数,CL为真实样本的输入参数的中间位置,n为真实样本的输入参数的数量;
虚拟样本的下边界和上边界为:
其中,LB为虚拟样本的输入参数的下边界,UB为虚拟样本的输入参数的上边界,SkewL和SkewU为左右扩展偏度,min为真实样本的输入参数的最小值,max为真实样本的输入参数的最大值,NL为真实样本中数值小于CL 的样本数量,NU为真实样本中数值大于CL的样本数量,SP为偏度修正因子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东理工大学,未经华东理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011565995.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:割草机及其转向操控方法
- 下一篇:一种微藻培养基及其应用





