[发明专利]一种类双塔模型的多特征交互网络招聘文本分类方法有效
| 申请号: | 202110600441.5 | 申请日: | 2021-05-31 |
| 公开(公告)号: | CN113342933B | 公开(公告)日: | 2022-11-08 |
| 发明(设计)人: | 高尚兵;张骏强;李文婷;相林;陈浩霖;于永涛;周君;朱全银;张正伟;汪长春;蔡创新;郝明阳;胡序洋;李少凡 | 申请(专利权)人: | 淮阴工学院 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/289;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 田凌涛 |
| 地址: | 210000 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 种类 模型 特征 交互 网络 招聘 文本 分类 方法 | ||
本发明涉及一种类双塔模型的多特征交互网络招聘文本分类方法,将招聘样本文本进行预处理,并处理成具有映射关系的稀疏特征文本和稠密特征文本;再通过预训练语言模型和one‑hot编码机制分别对两个特征文本进行序列向量化;随后将输出的两个序列向量分别送入预设第一特征提取模型和第二特征提取模型中进行二次特征提取,同时构建特征交互模型对两路特征提取网络进行多特征交互并输出,最后将三者输出的特征向量融合拼接,并进行注意力加权并降维分类输出;整个设计方案引入两种特征分布不同的招聘文本,并进行区别化处理,然后在网络之间构建了一种多特征交互机制,充分学习数据差异性所带来的特征在多样性上提升,从而提高招聘文本分类精度。
技术领域
本发明涉及一种类双塔模型的多特征交互网络招聘文本分类方法,属于自然语言文本处理技术领域。
背景技术
网上在线招聘和投递简历逐渐成为企业招聘人才和年轻人求职就业的主要途径。透过网络招聘文本可以了解某个行业对当下乃至未来该领域人才技能的需求,从而更好地为高校制定符合企业需求的专项人才培养计划,缓解毕业生就业难的压力,同时也可以为该领域企业一定程度上提供未来招聘人才的方向,推动企业发展。
各行各业让人目不暇接的职业种类,以及网络招聘文本数据量大,更新快的特点使得人工分类显得极其不方便,对网络招聘文本实现自动分类从而方便后续分析的需求与日俱增。而传统的文本分类模型过分依赖于模型内分类器性能的好坏,而分类器性能又很大程度上取决于设计该分类器的专家所拥有的知识丰富程度。因此,模型表现出来的性能往往受人为因素影响较大。
发明内容
本发明所要解决的技术问题是提供一种类双塔模型的多特征交互网络招聘文本分类方法,基于招聘文本对应稀疏特征文本和稠密特征文本的划分,设计个性化二次特征提取网络、以及特征交互模型,实现多特征融合,能够有效提高招聘文本的分类精度,为就业数据进一步分析提供准确的依据。
本发明为了解决上述技术问题采用以下技术方案:本发明设计了一种类双塔模型的多特征交互网络招聘文本分类方法,执行如下步骤I至步骤VI,获得招聘文本分类概率模型,以及执行如下步骤A至步骤B,实现对目标招聘文本的分类;
步骤I.收集各条招聘样本文本,并确定各招聘样本文本分别对应预设各招聘分类类别中的真实分类类别,并分别针对各条招聘样本文本,按预设各稠密属性与预设各稀疏属性,将招聘样本文本划分为稀疏特征文本和稠密特征文本,进而获得各条招聘样本文本分别所对应的稀疏特征文本和稠密特征文本,然后进入步骤II;
步骤II.分别针对各条招聘样本文本,获得其稀疏特征文本所对应的字向量序列,以及获得其稠密特征文本所对应的one-hot向量序列,进而获得各条招聘样本文本分别所对应的字向量序列与one-hot向量序列,然后进入步骤III;
步骤III.基于对应字向量序列的预设第一特征提取模型、对应one-hot向量序列的预设第二特征提取模型、各特征提取模型分别对应的特征自交互模型、以及两特征提取模型之间的全局特征交互模型,以预设第一特征提取模型输入端、预设第二特征提取模型输入端为输入,预设第一特征提取模型输出端、预设第二特征提取模型输出端、以及各特征自交互模型输出端对接特征融合层的输入端,特征融合层的输出端依次串联注意力层、softmax层,构建文本分类初始概率模型,然后进入步骤VI;
步骤VI.以各招聘样本文本分别所对应的字向量序列与one-hot向量序列为输入,各招聘样本文本分别对应预设各招聘分类类别的概率为输出,结合各招聘样本文本分别对应预设各招聘分类类别中的真实分类类别,针对文本分类初始概率模型进行训练,获得招聘文本分类概率模型;
步骤A.按步骤I至步骤II,获得目标招聘文本所对应的字向量序列与one-hot向量序列,然后进入步骤B;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于淮阴工学院,未经淮阴工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110600441.5/2.html,转载请声明来源钻瓜专利网。





