[发明专利]一种基于CART决策树的大学生就业预测方法在审
申请号: | 202111608264.1 | 申请日: | 2021-12-24 |
公开(公告)号: | CN114330716A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 党向盈;鲍蓉;姜代红;徐玮玮;佟恒乐;王晓雪 | 申请(专利权)人: | 徐州工程学院 |
主分类号: | G06N5/00 | 分类号: | G06N5/00;G06Q10/04;G06Q50/20 |
代理公司: | 徐州市三联专利事务所 32220 | 代理人: | 何君 |
地址: | 221000 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 cart 决策树 大学生 就业 预测 方法 | ||
本发明公布了一种基于CART决策树的大学生就业预测方法,旨在提供一种预测大学生就业情况的方法。本发明首先对大学生数据信息预处理,形成规范的、可供数据挖掘的基本属性数据集;然后,利用皮尔森相关分析法,确定数据集中大学生基本属性与就业预测目标属性的相关性,将与就业预测目标属性相关的大学生基本属性,确定为用于构建大学生就业预测模型的特征向量;最后,基于训练集,由特征向量计算基尼系数;采用基于CART决策树算法,构建大学生就业预测模型。本发明方法能够根据大学生信息数据集预测大学生就业情况,为高校就业管理部门提供智能化服务,指导学生合理就业,有助于提高大学生的就业率。
技术领域
本发明涉及人工智能信息化、大数据分析技术领域,具体是根据以往大学生就业大数据信息,基于CART决策树构建大学生就业预测模型,预测大学生就业情况。
背景技术
2019年大学大学生人数高达830万人,2020年大学生人数将突破840万人。如果再加上将近30万留学归国学生和以前还没有找到工作的大学生,以及社会再就业人士的数量,2020年将会有接近一千万人同时参与到就业机会的竞争中去。国内就业形势压力巨大,新增劳动力远远超过新增的就业机会,且由于国家高等教育进程不断发展,高素质人才比比皆是,严重加剧了当代大学生的就业竞争激烈程度。其次,就业结构不均衡问题也非常严重。从就业地区上看,更多的大学生愿意是在一、二线地区就业发展,而不太愿意去三四线城市发展。然而,大学生在校期间的表现,比如成绩,是否学生干部等因素会影响他们就业情况,同时从学科专业角度,学习工科的大学生就业形势稍好,文科专业的就业形势不容乐观。
决策树属于人工智能领域中的一种监督学习模型,其包含ID3、C4,5和CART(Classification And Regression Tree)三种是典型的分类预测算法。决策树中的节点代表某个属性值,分叉代表该节点所代表的属性所有可能的取值,叶节点代表从根节点到当前叶节点的关联规则的预测结果。决策树可以有单一输出也可以有复数输出。数据挖掘工作中经常运用决策树模型来完成预测数据挖掘任务。决策树的生成过程十分复杂,首先需要针对准备好的数据集以及挖掘目标来选定合适的决策树算法,不同的决策树算法适用于不同的挖掘任务;对于已经构建好的决策树模型,需要从原数据集中划分出一定数据数量的测试集,将测试集用于评估已经构建好的决策树模型准确率,分析决策树模型是否符合挖掘目的。
现有大学生就业预测方法中,考虑大学生就业信息中的相关属性的影响比较少。本方法使用决策树算法中较为经典的CART算法来构建就业预测模型。预测功能的实现,首先根据对收集到的数据进行清洗和相关性分析等预处理,然后基于CART决策树构建模型,并完成模型训练,所构建模型可以进行大学生就业地区、职位、薪金等预测,从而进一步实现大学生相关职位的推荐。
发明内容
为了解决大学生就业情况预测技术中的不足,本发明提供了一种基于CART决策树的大学生就业预测方法,根据大学生信息数据中的基本属性确定与就业情况相关属性,构建一种CART决策树预测模型,该模型能够预测大学生就业情况。
本发明采用的技术方案:一种基于CART决策树的大学生就业预测方法,该方法包括以下步骤:
S1:大学生信息数据的预处理;
收集大学生原始数据,构建学生数据基本属性集合,并对每个数据进行规范化处理,形成规范的数据集,大学生数据基本属性集合记为N={n1,n2,…,nc},其中ni为第i个基本属性,c为基本属性的个数;
S2:确定影响大学生就业预测目标的相关属性;
设大学生就业预测目标属性集合为Y={y1,y2,…y|Y|},其中|Y|为预测目标属性的取值个数,yu为预测目标属性值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于徐州工程学院,未经徐州工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111608264.1/2.html,转载请声明来源钻瓜专利网。