[发明专利]一种分类模型构建方法、装置及终端设备在审
申请号: | 201710565394.9 | 申请日: | 2017-07-12 |
公开(公告)号: | CN107480696A | 公开(公告)日: | 2017-12-15 |
发明(设计)人: | 马超;王坤昊;韩丽屏;于成龙 | 申请(专利权)人: | 深圳信息职业技术学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 深圳中一专利商标事务所44237 | 代理人: | 官建红 |
地址: | 518029 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分类 模型 构建 方法 装置 终端设备 | ||
技术领域
本发明属于数据处理技术领域,尤其涉及一种分类模型构建方法、装置及终端设备。
背景技术
智能分类的基本原理是利用一些建模分类的方法对训练数据集进行分析,通过对训练数据集的特征分析和自主学习,建立训练好的分类模型,从而进一步对未知数据进行分析和分类。
传统的机器学习方法进行分类模型构建时,由于算法本身的限制,其难对数据量较大的训练数据集进行训练,从而使得最终构建的分类模型精确度不够理想。深度学习是机器学习领域一个新的研究方向,近年来在语音识别、计算机视觉等领域应用中得到了突破性进展,它通过多个变换阶段分层对数据特征进行描述,组合低层特征形成更加抽象的高层表示、属性类别或特征,给出数据的分层特征表示。而深度学习所得到的深度网络结构包含大量的单一元素(神经元),每个神经元与大量其他神经元相连接,神经元间的连接强度(权值)在学习过程中修改并决定网络的功能,通过深度学习得到的深度网络结构符合神经网络的特征,即深度神经网络。随着深度学习方法的提出与深入研究,利用深度学习方法构建出的神经网络分类模型,极大地提高了传统机器学习方法构建的分类模型的准确率。
但是现有的神经网络分类模型中每层的网络的参数如权重值难以确定,而参数取值不当很容易使得神经网络分类模型陷入局部极值,找不到全局最优解,从而使得构建出的神经网络分类模型分类不够准确,同时通过深度学习方法构建神经网络分类模型,其模型训练速度慢所需的学习时间较长。
综上可知,现有技术中基于深度学习方法构建的分类模型分类准确率较低,且模型训练时间较长,使得现有技术中基于深度学习方法构建的分类模型的分类效率低下。
发明内容
有鉴于此,本发明实施例提供了一种分类模型构建方法、装置及终端设备,以解决现有技术中基于深度学习方法构建的分类模型的分类效率低下的问题。
本发明实施例的第一方面提供了一种分类模型构建方法,包括:
对用于构建分类模型的训练数据集进行优化,所述优化的过程包括:
获取第一训练数据集,并对所述第一训练数据集中所有数据的数据属性特征进行归一化处理,得出所述第一训练数据集中,每种数据的数据属性特征在所述归一化处理之后对应的特征值;
基于集成学习方法,对深度神经网络中神经网络层的极限学习机分类器进行构建;
基于所述特征值,利用所述极限学习机分类器对所述第一训练数据集进行因子相关性计算,并利用得出的因子相关系数,对所述极限学习机分类器进行筛选,确定出所需的极限学习机分类器以及所述所需的极限学习机分类器对应的权重值;
根据所述因子相关系数以及所述权重值,对所述第一训练数据集进行重新构建,并得到所述神经网络层输出的第二训练数据集;
在所述优化的过程结束之后,若满足预设的收敛条件,则基于当前的所述第二训练数据集,进行分类模型的构建;
若不满足预设的收敛条件,则将所述第二训练数据集作为所述第一训练数据集,并再次执行所述优化的过程。
本发明实施例的第二方面提供了一种分类模型构建装置,包括:
数据集优化模块,用于对用于构建分类模型的训练数据集进行优化,所述优化的过程包括:
数据获取模块,用于获取第一训练数据集,并对所述第一训练数据集中所有数据的数据属性特征进行归一化处理,得出所述第一训练数据集中,每种数据的数据属性特征在所述归一化处理之后对应的特征值;
学习机构建模块,用于基于集成学习方法,对深度神经网络中每一层的极限学习机分类器进行构建;
权重计算模块,用于基于所述特征值,利用所述极限学习机分类器对所述第一训练数据集进行因子相关性计算,并利用得出的因子相关系数,对所述极限学习机分类器进行筛选,确定出所需的极限学习机分类器以及所述所需的极限学习机分类器对应的权重值;
数据构建模块,用于根据所述因子相关系数以及所述权重值,对所述第一训练数据集进行重新构建,并得到所述神经网络层输出的第二训练数据集;
模型构建模块,用于在所述优化的过程结束之后,若满足预设的收敛条件,则基于当前的所述第二训练数据集,进行分类模型的构建;
逐层优化模块,用于若不满足预设的收敛条件,则将所述第二训练数据集作为所述第一训练数据集,并再次执行所述优化的过程。
本发明实施例的第三方面提供了一种分类模型构建终端设备,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳信息职业技术学院,未经深圳信息职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710565394.9/2.html,转载请声明来源钻瓜专利网。