[发明专利]一种简历查重方法、简历查重系统在审
| 申请号: | 202110544936.0 | 申请日: | 2021-05-19 |
| 公开(公告)号: | CN113326687A | 公开(公告)日: | 2021-08-31 |
| 发明(设计)人: | 徐波 | 申请(专利权)人: | 多益网络有限公司;广州多益网络股份有限公司;广东利为网络科技有限公司 |
| 主分类号: | G06F40/194 | 分类号: | G06F40/194;G06F16/951 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 麦小婵;郝传鑫 |
| 地址: | 510000 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 简历 方法 系统 | ||
本发明公开一种简历查重方法、简历查重系统,所述方法包括:招聘方客户端获取待查重的简历文本,并向招聘方服务端发送简历文本;招聘方服务端对简历文本进行分段文本处理,生成待查重的的文本段;招聘方服务端在生成文本段后,发起查重请求,向查重接收服务端发送文本段;查重接收服务端将接收到的文本段推进队列以待查重;爬虫服务端从队列中依次读取要爬取的文本段,并在搜索引擎中对各文本段进行搜索、爬取、匹配和数据处理,得到与各文本段相似度最高的第一文本;爬虫服务端向招聘方服务端发送第一文本;招聘方服务端根据每一第一文本与其对应的文本段的相似度计算简历的查重率。本发明减少了简历查重所花费的时间和提高了简历查重结果的准确性。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种简历查重方法、简历查重系统。
背景技术
由于网络招聘具有覆盖面广、时效性强、成本低等优点,因此,目前大多数企业是通过网络招聘的。虽然网络招聘相比于传统线下招聘能够使企业接收到大量简历投递,从而能够更有机会招聘到优秀的人才,但是,大量的简历会降低招聘效率,特别是如今简历抄袭网络信息较为普遍的情况下,需要花费大量人力和时间甄选人才。
目前市面上鲜有识别简历抄袭的方案。市面上存在查重哈希签名矩阵方案也仅能从简历库中按照信息分类进行相似简历查询,得到候选简历集合,哈希签名矩阵库匹配只能在现有的简历库中搜索对应信息进行匹配,现有的简历库中只能记录已经投递了的简历信息。但是对于新投递的简历而言,简历中的信息基本与现有简历库中的信息无关。如果候选人在网上抄袭了一段文本,而这段文本从未在现有的简历库中出现过,则无法被识别出来,可以看出该方法的局限性比较大,无法达到抄袭判断的目的。另外,目前大多数企业为人工进行整段简历文本的搜索判断,基于市面上搜索引擎的搜索规则,整段文本搜索可能出现无法搜索或者搜索结果不准确等问题,浪费不必要的时间精力,增加额外的工作负担,若对简历文本进行人力分割文本,则会出现工作量大,重复率高,判断规则不一等问题,无法提高招聘的工作效率,满足简历抄袭判断的需求。
发明内容
本发明的目的在于提供一种简历查重方法、简历查重系统,以减少简历查重、简历抄袭判断所花费的时间,提高简历查重结果、简历抄袭判断结果的准确性。
第一方面,本发明实施例提供一种简历查重方法,包括:
招聘方客户端获取待查重的简历文本,并向招聘方服务端发送所述简历文本;
所述招聘方服务端接收所述简历文本,并根据预设的规则对所述简历文本进行分段文本处理,生成待查重的的文本段;
所述招聘方服务端在生成所述文本段后,发起查重请求,向查重接收服务端发送所述文本段;
所述查重接收服务端接收所述文本段,并将接收到的文本段推进队列以待查重;
爬虫服务端从所述队列中依次读取要爬取的文本段,并在搜索引擎中对各文本段进行搜索、爬取、匹配和数据处理,得到与各文本段相似度最高的第一文本;
所述爬虫服务端向所述招聘方服务端发送所述第一文本;
所述招聘方服务端根据每一所述第一文本与其对应的文本段的相似度计算所述简历的查重率。
优选地,所述简历查重方法还包括:
所述招聘方服务端将所述查重率和预设的阈值进行比较,得到比较结果;
所述招聘方服务端向所述招聘方客户端发送所述比较结果;
所述招聘方客户端接收所述比较结果,当所述比较结果为所述查重率大于等于所述阈值,则为所述简历打上第一标记;其中,所述第一标记表示所述简历疑似抄袭;
当所述比较结果为所述查重率小于所述阈值,则为所述简历打上第二标记;其中,所述第二标记表示所述简历未发现抄袭。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于多益网络有限公司;广州多益网络股份有限公司;广东利为网络科技有限公司,未经多益网络有限公司;广州多益网络股份有限公司;广东利为网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110544936.0/2.html,转载请声明来源钻瓜专利网。





