[发明专利]一种职位推荐方法及系统有效
| 申请号: | 201811208036.3 | 申请日: | 2018-10-17 |
| 公开(公告)号: | CN109241446B | 公开(公告)日: | 2021-11-26 |
| 发明(设计)人: | 郑汉林;朱仕庆 | 申请(专利权)人: | 重庆汇博信息科技有限公司 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q10/10 |
| 代理公司: | 重庆西南华渝专利代理有限公司 50270 | 代理人: | 涂强 |
| 地址: | 400020 重庆市*** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 职位 推荐 方法 系统 | ||
1.一种职位推荐方法,其特征在于,包括以下步骤
步骤S1:获取用户访问数据,生成数据矩阵;
步骤S2:对数据矩阵执行监督学习算法;
步骤S3:对数据矩阵执行无监督学习算法并生成预测结果数据;
步骤S4:依据预测结果数据和人物画像数据生成职位预推荐数据;
所述步骤S1包括,
步骤S11:收集用户浏览招聘网站过程中的浏览职位数据、浏览企业数据、用户数据;
步骤S12:将步骤S11收集的数据以预设数据格式存储;
步骤S13:对所述以预设数据格式存储的数据分析数据特征并生成数据矩阵;
所述用户访问数据包括,设备类型、设备品牌、设备型号、浏览器类别、信息渠道、搜索内容、访问时间、访问职位,、是否投递、是否获取联系方式、访问企业中的多种或一种;
所述数据矩阵的数据特征包括,类别、薪酬、经验、学历、职别、群体中的多种或一种;
步骤21:对所述数据矩阵进行分解和降噪;
步骤22:基于访问记录进行相似度计算;
步骤23:从数据矩阵中抽取知识数据并存储;
所述步骤S21包括,
采用奇异值分解算法对原始数据矩阵进行处理,将原始数据矩阵分解为三个子矩阵U、∑和VT;原始矩阵Data是m行n列,对应的U、∑和VT分别为m行m列、m行n列和n行n列;计算表达式为:
所述步骤S22包括,
采用余弦相似度算法对用户数据中访问职位、企业的数据向量进行相似度计算,并得到访问职位、企业的数据向量夹角的余弦值;
若访问职位、企业的数据向量夹角的余弦值为90度,则相似度设定为0;
若访问职位、企业的数据向量的方向相同,则相似度设定为1.0;
计算表达式如下:
其中‖A‖和‖B‖表示向量A、B的2范数;
所述步骤S23包括,
获取访问职位的样本点中包含的数值型特征X1和X2;
通过梯度上升算法获取回归系数作为Logistic回归模型的参数;
所述步骤S23包括,
步骤S231:初始化每个回归系数为1;
步骤S232:重复若干次计算整个数据矩阵的梯度,采用alpha*gradient更新回归系数的向量;alpha是向目标移动的步长;
步骤S233:存储回归系数,并完成监督学习算法训练;
所述步骤S3包括,
步骤S31:采用k均值聚类算法对数据矩阵进行相似聚类;
步骤S32:采用FP-growth算法对数据矩阵进行关联性分析并生成预测结果数据;
所述步骤S31包括,
步骤S311:随机创建k个点作为起始质心;
步骤S312:若任意一个点的簇心分配结果发生改变,则对数据集中的每个数据点,对每个质心,计算质心与数据点之间的距离,并将数据点分配到距其最近的簇;
步骤S313:对每一个簇计算簇中所有点的均值并将均值作为质心;
步骤S314:使用量化的误差指标对算法结果进行评价;
所述步骤S32包括,
步骤S321:将数据矩阵中访问职位数据集离散化,将其量化位离散值;
步骤S322:第一次遍历数据矩阵,获取每个元素项的出现频率,去掉不满足的元素项,读入每个项集并将其保存,并按照出现的频率进行排序并过滤后,构建FP树并对树进行挖掘,完成无监督学习算法训练;
步骤S323:提取经常出现的元素项生成预测结果数据;
所述步骤S4包括,
步骤41:将预测结果数据与人物画像进行相似度计算生成关键元素信息,用于预推荐;
步骤42:向用户展示预推荐的职务信息;
数据矩阵为:[a1[职位1,职位2,…,职位n],a2[职位1,职位2,…,职位n],…,an[职位1,职位2,…,职位n]],[a1[企业1,企业2,…,企业n],a2[企业1,企业2,…,企业n],…,am[企业1,企业2,…,企业n]];[职位1[类别1,薪酬1,…,区域1],职位2[类别2,薪酬2,…,区域2],…,职位n[类别n,薪酬n,…,区域n]];[企业1[行业1,薪酬1,…,规模1],企业2[行业2,薪酬2,…,规模2],…,企业z[行业z,薪酬z,…,规模z]]]。
2.一种职位推荐系统,包括以下模块:
数据获取模块,用于获取用户访问数据,生成数据矩阵;
监督学习模块,用于对数据矩阵执行监督学习算法;
无监督学习模块,用于对数据矩阵执行无监督学习算法并生成预测结果数据;
预测模块,用于依据预测结果数据和人物画像数据生成职位预推荐数据;
所述数据获取模块执行以下步骤,
步骤S11:收集用户浏览招聘网站过程中的浏览职位数据、浏览企业数据、用户数据;
步骤S12:将步骤S11收集的数据以预设数据格式存储;
步骤S13:对所述以预设数据格式存储的数据分析数据特征并生成数据矩阵;
所述用户访问数据包括,设备类型、设备品牌、设备型号、浏览器类别、信息渠道、搜索内容、访问时间、访问职位,、是否投递、是否获取联系方式、访问企业中的多种或一种;
所述数据矩阵的数据特征包括,类别、薪酬、经验、学历、职别、群体中的多种或一种;
所述监督学习模块执行以下步骤,
步骤21:对所述数据矩阵进行分解和降噪;
步骤22:基于访问记录进行相似度计算;
步骤23:从数据矩阵中抽取知识数据并存储;
所述步骤S21包括,
采用奇异值分解算法对原始数据矩阵进行处理,将原始数据矩阵分解为三个子矩阵U、∑和VT;原始矩阵Data是m行n列,对应的U、∑和VT分别为m行m列、m行n列和n行n列;计算表达式为:
所述步骤S22包括,
采用余弦相似度算法对用户数据中访问职位、企业的数据向量进行相似度计算,并得到访问职位、企业的数据向量夹角的余弦值;
若访问职位、企业的数据向量夹角的余弦值为90度,则相似度设定为0;
若访问职位、企业的数据向量的方向相同,则相似度设定为1.0;
计算表达式如下:
其中‖A‖和‖B‖表示向量A、B的2范数;
所述步骤S23包括,
获取访问职位的样本点中包含的数值型特征X1和X2;
通过梯度上升算法获取回归系数作为Logistic回归模型的参数;
所述步骤S23包括,
步骤S231:初始化每个回归系数为1;
步骤S232:重复若干次计算整个数据矩阵的梯度,采用alpha*gradient更新回归系数的向量;alpha是向目标移动的步长;
步骤S233:存储回归系数,并完成监督学习算法训练;
所述无监督学习模块执行以下步骤,
步骤S31:采用k均值聚类算法对数据矩阵进行相似聚类;
步骤S32:采用FP-growth算法对数据矩阵进行关联性分析并生成预测结果数据;
所述步骤S31包括,
步骤S311:随机创建k个点作为起始质心;
步骤S312:若任意一个点的簇心分配结果发生改变,则对数据集中的每个数据点,对每个质心,计算质心与数据点之间的距离,并将数据点分配到距其最近的簇;
步骤S313:对每一个簇计算簇中所有点的均值并将均值作为质心;
步骤S314:使用量化的误差指标对算法结果进行评价;
所述步骤S32包括,
步骤S321:将数据矩阵中访问职位数据集离散化,将其量化位离散值;
步骤S322:第一次遍历数据矩阵,获取每个元素项的出现频率,去掉不满足的元素项,读入每个项集并将其保存,并按照出现的频率进行排序并过滤后,构建FP树并对树进行挖掘,完成无监督学习算法训练;
步骤S323:提取经常出现的元素项生成预测结果数据;
所述预测模块执行以下步骤,
步骤41:将预测结果数据与人物画像进行相似度计算生成关键元素信息,用于预推荐;
步骤42:向用户展示预推荐的职务信息;
数据矩阵为:[a1[职位1,职位2,…,职位n],a2[职位1,职位2,…,职位n],…,an[职位1,职位2,…,职位n]],[a1[企业1,企业2,…,企业n],a2[企业1,企业2,…,企业n],…,am[企业1,企业2,…,企业n]];[职位1[类别1,薪酬1,…,区域1],职位2[类别2,薪酬2,…,区域2],…,职位n[类别n,薪酬n,…,区域n]];[企业1[行业1,薪酬1,…,规模1],企业2[行业2,薪酬2,…,规模2],…,企业z[行业z,薪酬z,…,规模z]]]。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆汇博信息科技有限公司,未经重庆汇博信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811208036.3/1.html,转载请声明来源钻瓜专利网。





