[发明专利]一种在线面试的方法与系统在审
申请号: | 201511031749.3 | 申请日: | 2015-12-31 |
公开(公告)号: | CN105678510A | 公开(公告)日: | 2016-06-15 |
发明(设计)人: | 关永奎 | 申请(专利权)人: | 北京擎宇信息技术有限公司 |
主分类号: | G06Q10/10 | 分类号: | G06Q10/10 |
代理公司: | 北京酷爱智慧知识产权代理有限公司 11514 | 代理人: | 李娜 |
地址: | 100000 北京市朝阳区南磨房路37号1*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 在线 面试 方法 系统 | ||
技术领域
本发明涉及数据处理领域,尤其涉及一种在线面试的方法与系统。
背景技术
随着互联网应用的普及,越来越多的人通过网络找工作,面对海量的在线求知者,即使经过面试筛选,企业也往往不清楚求职者的个人信息是否完全真实或者是否存在隐瞒。而现代人几乎都曾上网,网络上会留有许多合法信息。
发明内容
本发明的目的在于提供一种在线面试的方法与系统,对网络求职者的背景进行自动分析,旨在解决企业面试中无法确定求职者个人信息的真实性和完整性的问题。
本发明解决其技术问题所采用的技术方案是:
一种在线面试系统,包括:
数据处理装置,用于接收招聘客户端和求职客户端发送的待识别身份信息;在招聘客户端与求职客户端之间建立信息通道;接收招聘客户端和求职客户端之间的信息记录并存储;处理信息记录并将背景调查数据及真实性数据发送到招聘客户端;
招聘客户端,用于接收用户输入的待识别身份信息并发送到数据处理装置;接收用户输入的信息并发送到信息通道;接收数据处理装置发送的背景调查数据及真实性数据;
求职客户端,用于接收用户输入的待识别身份信息并发送到数据处理装置;接收用户输入的信息并发送到信息通道。
在此基础上,进一步地,所述数据处理装置用于:
接收招聘终客户端和求职客户端发送的待识别身份信息,并与预先设置的合法身份信息进行比对;所述合法身份信息存储于数据处理装置的数据库;在待识别身份信息合法时向招聘客户端和求职客户端返回用户数据;所述用户数据包括用户ID和用户在在线面试系统的统计数据;
在招聘客户端与求职客户端之间建立音视频信息通道和文字信息通道;接收招聘客户端与求职客户端之间的音视频信息记录和文字信息记录并存储在数据处理装置上;
调用数据处理装置中的注册信息记录和文字信息记录,筛选人物关键词并将所述人物关键词发送到检索引擎;
接收检索引擎返回的首次检索数据,根据预定的时间过滤规则滤除发布时间不合法的网络信息,将首次检索数据中的毕业学校信息数据、工作单位信息数据、违法违纪信息数据、家庭背景信息数据作为行踪数据,将所述行踪数据作为下一轮检索的入口参数,并结合所述人物关键词发送到检索引擎;
接收检索引擎返回的初步检索结果,在出现检索结果缺失或者结果不符时,将异常数据反馈到招聘客户端;
接收招聘客户端发送的更新后的行踪数据和人物关键词,进行下一轮检索;
重复预定轮数,获得最终检索结果页面;
采用统一资源定位符提取器分析最终检索结果页面,读取规定字段记录结果的页数,依次下载每一页,并提取其中包含的网页链接,将网页链接存储进下载队列中;
采用网页文档下载器读取下载队列中的每个统一资源定位符的地址,使用网络协议下载所述统一资源定位符对应的网页文档并存储到数据处理装置中;
对网页文档进行包括分词、人名提取、词项过滤、特征词项权重计算以及特征词项选择的预处理操作,其中特征词权重计算公式为:
其中,a是行踪数据中的一个或多个词串,b是人物关键词串,t是候选的多词串,|t|是多词串的长度,f(t)是多词串t在整个文档集合中出现的频次,Tt是以多词串t为字串的多词串集合,P(Ta)是集合Tt中的候选多词串个数;
为预处理后的每个文档生成一个向量,所述向量为根据特征选择条件选择的特征词项,所述向量构成向量集合,使用层次聚类算法对所述向量集合中的向量按照相似度进行分类,得到最终聚类结果,其中,所述层次聚类算法为:
(1)将网页文档集合D={d1,d2,...,dn}中的每一个文档di都视为一个文本簇ci,这样D就被初始化为C={c1,c2,...,cn};
(2)计算C中Cj(i<j≤n)与Ci(1≤i≤n)的聚类中心相似度sim(ci,cj),所述聚类中心相似度通过文本特征向量的余弦夹角计算而得;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京擎宇信息技术有限公司,未经北京擎宇信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201511031749.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理方法、装置及电子设备
- 下一篇:MRP计算过程控制方法和系统
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理