[发明专利]一种学生工作岗位推荐的方法和装置在审

申请号：	202011556026.6	申请日：	2020-12-24
公开（公告）号：	CN112686624A	公开（公告）日：	2021-04-20
发明（设计）人：	汤若聪;宋晨静;刘林峰;黄敏;李桐;巨泽建;侯登学;张宜红;王晓东	申请（专利权）人：	江苏金智教育信息股份有限公司
主分类号：	G06Q10/10	分类号：	G06Q10/10;G06K9/62;G06N3/04
代理公司：	江苏银创律师事务所 32242	代理人：	孙计良
地址：	211100 江苏省南***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种学生工作岗位推荐方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种学生工作岗位推荐的方法，其特征在于，该方法包括数据预处理步骤、模型训练步骤和岗位推荐分析步骤；所述数据预处理步骤包括联合特征预处理步骤、联合特征数值化样本生成步骤以及联合特征离散化样本生成步骤；

所述联合特征预处理步骤用于根据联合特征表和联合特征相关性值表对所述联合特征相关性值表中的联合特征之间的相关性值进行二值化处理得到联合特征之间的相关性二值化值c_i，k；若r_i，k＜R_threshold，则c_i，k＝1，否则c_i，k＝0；其中，c_i，k为第i个联合特征和第k个联合特征的相关性二值化值，r_i，k表示为第i个联合特征和第k个联合特征的相关性值，i∈[1..N]，k∈[1..N]，N是所述联合特征表中联合特征数，R_threshold是预先设定的阈值；

所述联合特征数值化样本生成步骤用于根据输入的学生的画像信息和岗位的特征信息，基于所述联合特征表构建联合样本的数值化向量；

所述联合特征离散化样本生成步骤用于根据输入的学生的画像信息、岗位的特征信息，基于所述联合特征表构建联合样本的低维稠密的实数化嵌入向量；

所述模型训练步骤包括以下步骤：

S21：获取历史学生的画像信息以及历史学生与岗位的交互关注记录；所述交互关注记录包括关注记录和交互记录；

S22：若某个历史学生is和某个岗位iw之间存在相应的交互关注记录，则通过所述联合特征数值化样本生成步骤生成联合样本的数值化向量S_p、通过所述联合特征离散化样本生成步骤生成联合样本对应的低维稠密的实数化嵌入向量E_p和该联合样本的样本标签Y_p；各联合样本的数值化向量S_p、低维稠密的实数化嵌入向量E_p和该联合样本的样本标签Y_p组成联合样本集S＝{{S_p，E_p，Y_p，is，iw}|p∈[1..Q]}，Q为联合样本数；

S_p为第p个联合样本的数值化向量：

S_p＝[s_p，1，s_p，2，...s_p，N]＝[x_is，1，x_is，2，...x_is，A，m_iw，1，m_iw，2，...m_iw，B]；其中，

s_p，i为第p个联合样本数值化向量中的第i个联合特征的数值化值，i∈[1..N]；

A为学生的特征数，x_is，u为学生is的第u个数值化特征，u∈[1..A]；

B为岗位的特征数，m_iw，v为岗位iw的第v个数值化特征，v∈[1..B]；

学生的特征数A、岗位的特征数B以及联合特征数N满足：N＝A+B；

is和iw分别表示为学生和岗位的识别码；

Y_p为第p个联合样本的样本标签：

若该学生is和该岗位iw之间存在交互记录，则样本标签Y_p＝1，否则样本标签Y_p＝0；

S23：根据所述联合特征之间的相关性二值化值，计算所述联合样本集S中各个联合样本的交叉特征值，得到各个联合样本的交叉特征向量φ_p；其中，

φ_p为第p个联合样本的交叉特征向量，φ_p＝[φ_p，1，φ_p，2，…，φ_p，N]；其中，

φ_p，k为第p个联合样本的第k个联合特征的交叉特征值，采用如下公式计算：

其中，

s_p，i为第p个联合样本数值化向量中的第i个联合特征的数值化值；

c_i，k为第i个联合特征和第k个联合特征的相关性二值化值；

p∈[1..Q]，i∈[1..N]，k∈[1..N]；

S24：根据各个联合样本的数值化向量和各个联合样本的交叉特征向量以及各联合样本对应的样本标签，通过对线性模型进行回归分析，得到第一权重向量W_wd和第一偏置项b；其中，为第一权重向量W_wd的转置，Y_p为第p个联合样本的样本标签，Sφ_p是联合样本的数值化向量S_p和交叉特征向量φ_p的连接，S_p为第p个联合样本的数值化向量；

S25：将各个联合样本对应的低维稠密的实数化嵌入向量逐个输入至深度神经网络模块中进行训练；所述深度神经网络模块中，包括若干隐藏层；每一隐藏层做如下处理：

a_l+1＝Activation(Normalization(Cut(d_l，Activation(W_l^Ta_l+b_l))))；

其中，Activation为激活函数，Normalization为归一化函数，Cut为向量长度调整函数，l表示隐藏层的层次，a_l为第l隐藏层的输入向量，a_l+1为第l隐藏层的输出向量，第一隐藏层的输入向量a₁为所输入的低维稠密的实数化嵌入向量的融合，d_l为向量长度调整函数Cut所调整的向量长度，W_l^T为向量W_l的转置，W_l和b_l由深度神经网络模块自动确定；

S26：训练结束后提取深度神经网络模块中的W_l和a_l并计算出b_d＝W_l^Ta_l；

所述岗位推荐分析步骤包括如下步骤：

S31：获取被分析学生的画像信息；

S32：根据所述联合特征数值化样本生成步骤生成该被分析学生与各个岗位之间的联合样本的数值化向量s_t，iw；其中，s_t，iw为被分析学生t的对岗位iw的联合样本的数值化向量；

S33：根据所述联合特征之间的相关性二值化值，计算所述被分析学生与各个岗位之间的联合样本的交叉特征值，组成该被分析学生对各个岗位的联合样本的交叉特征向量φ_t，iw

其中，

φ_t，iw为被分析学生t的对岗位iw的交叉特征向量，φ_t，iw＝[φ_t，iw，1，φ_t，tw，2，…，φ_t，iw，N]；其中，

φ_t，iw，k为被分析学生t的对岗位iw的第k个联合特征的交叉特征值，采用如下公式计算：

其中，

s_t，iw，i为被分析学生t的对岗位iw的联合样本的的第i个联合特征的数值化值，

c_i，k为第i个联合特征和第k个联合特征的相关性二值化值；k∈[1..N]；

S34：根据该被分析学生与各个岗位之间的联合样本的数值化向量和该被分析学生对各个岗位的联合样本的交叉特征向量，计算出该被分析学生从事各个岗位的概率：