[发明专利]一种学生工作岗位推荐的方法和装置在审
| 申请号: | 202011556026.6 | 申请日: | 2020-12-24 |
| 公开(公告)号: | CN112686624A | 公开(公告)日: | 2021-04-20 |
| 发明(设计)人: | 汤若聪;宋晨静;刘林峰;黄敏;李桐;巨泽建;侯登学;张宜红;王晓东 | 申请(专利权)人: | 江苏金智教育信息股份有限公司 |
| 主分类号: | G06Q10/10 | 分类号: | G06Q10/10;G06K9/62;G06N3/04 |
| 代理公司: | 江苏银创律师事务所 32242 | 代理人: | 孙计良 |
| 地址: | 211100 江苏省南*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 学生 工作岗位 推荐 方法 装置 | ||
1.一种学生工作岗位推荐的方法,其特征在于,该方法包括数据预处理步骤、模型训练步骤和岗位推荐分析步骤;所述数据预处理步骤包括联合特征预处理步骤、联合特征数值化样本生成步骤以及联合特征离散化样本生成步骤;
所述联合特征预处理步骤用于根据联合特征表和联合特征相关性值表对所述联合特征相关性值表中的联合特征之间的相关性值进行二值化处理得到联合特征之间的相关性二值化值ci,k;若ri,k<Rthreshold,则ci,k=1,否则ci,k=0;其中,ci,k为第i个联合特征和第k个联合特征的相关性二值化值,ri,k表示为第i个联合特征和第k个联合特征的相关性值,i∈[1..N],k∈[1..N],N是所述联合特征表中联合特征数,Rthreshold是预先设定的阈值;
所述联合特征数值化样本生成步骤用于根据输入的学生的画像信息和岗位的特征信息,基于所述联合特征表构建联合样本的数值化向量;
所述联合特征离散化样本生成步骤用于根据输入的学生的画像信息、岗位的特征信息,基于所述联合特征表构建联合样本的低维稠密的实数化嵌入向量;
所述模型训练步骤包括以下步骤:
S21:获取历史学生的画像信息以及历史学生与岗位的交互关注记录;所述交互关注记录包括关注记录和交互记录;
S22:若某个历史学生is和某个岗位iw之间存在相应的交互关注记录,则通过所述联合特征数值化样本生成步骤生成联合样本的数值化向量Sp、通过所述联合特征离散化样本生成步骤生成联合样本对应的低维稠密的实数化嵌入向量Ep和该联合样本的样本标签Yp;各联合样本的数值化向量Sp、低维稠密的实数化嵌入向量Ep和该联合样本的样本标签Yp组成联合样本集S={{Sp,Ep,Yp,is,iw}|p∈[1..Q]},Q为联合样本数;
Sp为第p个联合样本的数值化向量:
Sp=[sp,1,sp,2,...sp,N]=[xis,1,xis,2,...xis,A,miw,1,miw,2,...miw,B];其中,
sp,i为第p个联合样本数值化向量中的第i个联合特征的数值化值,i∈[1..N];
A为学生的特征数,xis,u为学生is的第u个数值化特征,u∈[1..A];
B为岗位的特征数,miw,v为岗位iw的第v个数值化特征,v∈[1..B];
学生的特征数A、岗位的特征数B以及联合特征数N满足:N=A+B;
is和iw分别表示为学生和岗位的识别码;
Yp为第p个联合样本的样本标签:
若该学生is和该岗位iw之间存在交互记录,则样本标签Yp=1,否则样本标签Yp=0;
S23:根据所述联合特征之间的相关性二值化值,计算所述联合样本集S中各个联合样本的交叉特征值,得到各个联合样本的交叉特征向量φp;其中,
φp为第p个联合样本的交叉特征向量,φp=[φp,1,φp,2,…,φp,N];其中,
φp,k为第p个联合样本的第k个联合特征的交叉特征值,采用如下公式计算:
其中,
sp,i为第p个联合样本数值化向量中的第i个联合特征的数值化值;
ci,k为第i个联合特征和第k个联合特征的相关性二值化值;
p∈[1..Q],i∈[1..N],k∈[1..N];
S24:根据各个联合样本的数值化向量和各个联合样本的交叉特征向量以及各联合样本对应的样本标签,通过对线性模型进行回归分析,得到第一权重向量Wwd和第一偏置项b;其中,为第一权重向量Wwd的转置,Yp为第p个联合样本的样本标签,Sφp是联合样本的数值化向量Sp和交叉特征向量φp的连接,Sp为第p个联合样本的数值化向量;
S25:将各个联合样本对应的低维稠密的实数化嵌入向量逐个输入至深度神经网络模块中进行训练;所述深度神经网络模块中,包括若干隐藏层;每一隐藏层做如下处理:
al+1=Activation(Normalization(Cut(dl,Activation(WlTal+bl))));
其中,Activation为激活函数,Normalization为归一化函数,Cut为向量长度调整函数,l表示隐藏层的层次,al为第l隐藏层的输入向量,al+1为第l隐藏层的输出向量,第一隐藏层的输入向量a1为所输入的低维稠密的实数化嵌入向量的融合,dl为向量长度调整函数Cut所调整的向量长度,WlT为向量Wl的转置,Wl和bl由深度神经网络模块自动确定;
S26:训练结束后提取深度神经网络模块中的Wl和al并计算出bd=WlTal;
所述岗位推荐分析步骤包括如下步骤:
S31:获取被分析学生的画像信息;
S32:根据所述联合特征数值化样本生成步骤生成该被分析学生与各个岗位之间的联合样本的数值化向量st,iw;其中,st,iw为被分析学生t的对岗位iw的联合样本的数值化向量;
S33:根据所述联合特征之间的相关性二值化值,计算所述被分析学生与各个岗位之间的联合样本的交叉特征值,组成该被分析学生对各个岗位的联合样本的交叉特征向量φt,iw
其中,
φt,iw为被分析学生t的对岗位iw的交叉特征向量,φt,iw=[φt,iw,1,φt,tw,2,…,φt,iw,N];其中,
φt,iw,k为被分析学生t的对岗位iw的第k个联合特征的交叉特征值,采用如下公式计算:
其中,
st,iw,i为被分析学生t的对岗位iw的联合样本的的第i个联合特征的数值化值,
ci,k为第i个联合特征和第k个联合特征的相关性二值化值;k∈[1..N];
S34:根据该被分析学生与各个岗位之间的联合样本的数值化向量和该被分析学生对各个岗位的联合样本的交叉特征向量,计算出该被分析学生从事各个岗位的概率:
其中,Pt,iw为被分析学生t从事岗位iw的概率;
Sφt,iw是联合样本的数值化向量st,iw和交叉特征向量φt,iw的连接;
st,iw为被分析学生t的对岗位iw的联合样本的数值化向量;
φt,iw为被分析学生t的对岗位iw的交叉特征向量;
S35:根据所述被分析学生从事各个岗位的概率大小对岗位进行降序排序,选取其中前TopN个岗位作为该被分析学生的工作岗位推荐结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏金智教育信息股份有限公司,未经江苏金智教育信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011556026.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种斜面抬升的升降桌面
- 下一篇:一种珍珠棉发泡机用截断装置
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





