[发明专利]一种基于双向推荐的在线招聘系统有效
| 申请号: | 201610008852.4 | 申请日: | 2016-01-07 |
| 公开(公告)号: | CN105488662B | 公开(公告)日: | 2021-09-03 |
| 发明(设计)人: | 赵鹏 | 申请(专利权)人: | 北京华品博睿网络技术有限公司 |
| 主分类号: | G06Q10/10 | 分类号: | G06Q10/10;G06F16/9535;H04L29/08 |
| 代理公司: | 北京君泊知识产权代理有限公司 11496 | 代理人: | 周倩 |
| 地址: | 100028 北京市朝阳区太*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 双向 推荐 在线 招聘 系统 | ||
1.一种基于双向推荐的在线招聘系统,其特征在于,包括:离线分析模块、推荐中心模块、在线服务模块,其中:
离线分析模块用于对用户静态信息和用户行为记录做离线挖掘和特征计算,具体包括数据收集模块、数据预处理模块、特征提取模块、模型训练模块;数据收集模块主要用于收集各种用户信息和用户日志,收集完成并整理入库;数据预处理模块涉及对数据的整理、清洗,用户信息按字段做格式化,用户行为按时间序列分块;特征提取模块从整理完成的数据中抽取各种特征,用于后续的模型训练;模型训练模块收集特征和训练集,训练学习出一系列模型,包括用户兴趣模型、用户内容特征模型、用户需求紧迫度模型、用户曝光饱和度模型;
推荐中心模块用于对请求用户计算相应的推荐列表,包括数据检索模块、推荐计算模块、实时反馈分析模块;数据检索模块主要从海量数据召回初步推荐候选集,主要通过建立倒排索引和内存缓存实现;推荐计算模块主要从已召回的推荐候选集中挑选出最符合需求的推荐结果,使用了融合模型做推荐计算,主要基于双向匹配度,需求紧迫度和曝光范围饱和度特征;实时反馈分析模块主要是收集线上用户的实时反馈,通过这些反馈信息动态调整已计算出的用户特征,且相应调整最终的推荐结果;
在线服务模块用于处理用户拿到推荐列表之后所发生的查看、收藏、对话各种行为,包括用户交互模块和反馈收集模块;用户交互模块用于所有用户客户端与服务端之间的通信,消息转发以及用户间互动;反馈收集模块用于实施收集用户行为反馈且传给推荐中心模块做反馈分析;
其中推荐算法进行计算的具体步骤如下:
步骤1. 利用用户提交的静态信息和用户行为记录,分别对招聘方和求职方建立兴趣模型和特征模型,计算双向偏好、用户‘需求紧迫度’、饱和度,
包括:
1.1 收集求职方和招聘方的静态信息,从静态信息中挖掘出一系列基于内容的特征,包括:招聘|求职岗位、工作年限、所在城市、教育背景、工作经验、软技能;
1.2 收集求职方和招聘方提交的标签信息,通过关联规则的方法挖掘出扩展标签,用于匹配度计算;
1.3 收集用户历史行为信息包括用户的查看、收藏、对话记录,按时间顺序组成行为序列,从中挖掘出一系列行为特征,包括:用户活跃度,用户活跃时间分布,用户偏好特征,用户需求紧迫度,用户“曝光范围”饱和度;
1.4 对用户关注过查看、收藏、对话的相关信息,通过协同过滤的方法计算出兴趣度矩阵;
步骤2. 推荐过程:
2.1 使用混合模型包括协同过滤推荐和基于内容推荐召回候选人列表,分别对每个候选人计算他与推荐请求人的双向匹配度;根据双向匹配度和其他特征做排序;
2.2 对多个模型的初步推荐结果做个性化融合,融合策略基于以下特征:用户活跃度,用户“曝光范围”饱和度,用户是否新注册;
步骤3. 收集用户反馈
3.1 实时收集用户的查看,收藏,对话记录,通过消息队列发给线上做实时反馈;
3.2 周期性同步用户查看,收藏,对话记录,用于离线数据分析;
在上述步骤1.3中, 用户偏好特征的挖掘和计算方法如下:
1.3.1 收集招聘方历史关注过的求职者信息,对这些求职者信息抽取特征向量,使用这些求职者信息样本及其特征训练招聘方兴趣模型;
1.3.2 收集求职方历史关注过的招聘者信息,对这些招聘者信息抽取特征向量,使用这些招聘者信息样本及其特征训练求职方兴趣模型;
1.3.3 在离线环境下使用兴趣模型对全量用户计算偏好特征后,导入线上存贮,用于线上的匹配度计算;
在上述步骤1.3中,用户对某个候选信息的单向匹配度计算方法如下:
1.3.4 使用兴趣模型计算用户的偏好特征;
1.3.5 读取候选信息的内容特征向量,该特征向量在上述步骤1.1中离线计算得到;
1.3.6 计算用户偏好特征与候选信息内容特征向量之间的相似度,得到用户对该候选信息的单向匹配度;
在上述步骤1.3中,用户‘需求紧迫度’挖掘方法如下:
1.3.7 挖掘用户近期活跃频度,抽取活跃度特征;挖掘用户近期活跃时间,抽取活跃时间分布特征;
1.3.8 计算所有用户近期内关注的候选信息的单向匹配度,计算单向匹配度方差;
1.3.9 将上述计算的结果作为训练集,训练用户‘需求紧迫度’回归模型,用回归模型计算出每个用户的‘需求紧迫度’;
在上述步骤1.3中,用户“曝光范围”饱和度的挖掘方法如下:
1.3.10 挖掘该用户近期活跃频度,以及该用户近期‘查看’数,‘收藏’数,‘对话’数特征;
1.3.11 挖掘该用户近期“曝光范围”,以及该用户近期‘被查看’次数,‘被收藏’次数,‘被对话’次数特征;
1.3.12 挖掘该用户近期‘响应查看’次数,‘响应收藏’次数,‘响应对话’次数特征;
1.3.13 将上述结果做为训练集,学习饱和度回归模型,用这个回归模型计算出所有用户的“曝光范围”饱和度来;
在上述步骤2.1中,双向匹配度的计算方法如下:
2.1.1 对请求用户选择最可能的候选集列表,先计算该用户对每个候选信息的单向匹配度;
2.1.2 读取该请求用户的‘需求紧迫度’,‘需求紧迫度’在步骤1.3中已经离线计算得出,该‘需求紧迫度’将作为步骤2.1.1中单向匹配度的权重来使用;
2.1.3 对每个候选信息,反向计算该候选信息用户对请求用户的单向匹配度;
2.1.4 对每个候选信息用户,读取该候选信息用户的‘需求紧迫度’,该‘需求紧迫度’在步骤1.3中已经离线计算得出,该‘需求紧迫度’将作为步骤2.1.3中单向匹配度的权重来使用;
2.1.5 将双方的匹配度分别按照‘需求紧迫度’的权重做线性加和,得出双向匹配度;
在上述步骤2.2中,对多个模型推荐结果的个性化融合策略如下:
2.2.1 读取请求用户的‘需求紧迫度’,“曝光范围”饱和度,近期活跃度特征;
2.2.2 读取每个候选推荐结果用户的“曝光范围“饱和度,近期活跃度,近期曝光次数特征,对其按“曝光范围”动态打分过滤;
2.2.3 对于‘需求紧迫度’较高的用户,需要放宽匹配度,调高对方用户的主动性,且强调新颖性,所以适当放宽匹配度过滤阈值,增加候选用户的活跃度和‘需求紧迫度’的权重,且适当调高基于协同过滤的推荐结果比例;
2.2.4 筛选后的结果,按以上各种特征排序后给出最终的推荐融合结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京华品博睿网络技术有限公司,未经北京华品博睿网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610008852.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高粘性胶印联机冷烫胶粘剂
- 下一篇:4-1BB结合分子
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





