[发明专利]一种基于验证码的数据样本识别系统及其方法有效
| 申请号: | 201910065908.3 | 申请日: | 2019-01-24 | 
| 公开(公告)号: | CN109783822B | 公开(公告)日: | 2023-04-18 | 
| 发明(设计)人: | 陈杨;刘作;陈星辰;韦云;张其卿;廖景航 | 申请(专利权)人: | 中国—东盟信息港股份有限公司 | 
| 主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F16/61;H04L67/51;G10L25/51 | 
| 代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 谭连香 | 
| 地址: | 530200 广西壮*** | 国省代码: | 广西;45 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 验证 数据 样本 识别 系统 及其 方法 | ||
本发明公开了一种基于验证码的数据样本识别系统及其方法,用户通过用户终端与数据样本识别模块连接,实现两者的信息互交,用户通过用户终端发起校验请求,通过主要由采集服务器、样本数据库、呼叫终端和放音模块构成的所述数据样本识别模块为用户终端提供验证与识别服务。使用时,数据样本识别模块根据校验请求调取相应的数据样本,用户根据指令通过用户终端输入验证码和识别结果;数据样本识别模块对调取的数据样本和用户输入的样本进行验证对比,对比成功则表示识别成功,将该数据样本存入样本数据库,否则丢弃。整个过程,只需用户验证参与即可,无需人工现场识别,与传统人工识别的做法相比,具有数据样本识别工作量少、识别成本低的特点。
技术领域
本发明涉及一种数据样本识别技术,特别是一种基于验证码的数据样本识别系统及其方法。
背景技术
随着人工智能和大数据的迅猛发展,数据样本的识别与处理显得越来越重要。越来越多领域采用人工智能来对数据样本进行识别。虽然现有人工智识别技术较为成熟,但也只能识别大多数常用的文字/语音样本。因此,现有人工智能识别还是存在部分人工智能无法处理的边边角角(例如带有方言、或个人口音的语音样本,亦或者是在人工识别系统暂未训练存储的样本等),均需要人工参与来识别,识别范围存在局限性。对于带有方言或带有个人口音的语音样本的识别,现有技术中常常会寻找具有同一特点或技术人员去到现场来进行现场问答,以得到准确的识别结果。在数据识别过程,人工参与度高,数据样本的识别成本较高。特别是将识别后的语音样本进行标记也存在着极大的挑战。
验证码(CAPTCHA)是“Completely Automated Public Turing test to tellComputers and Humans Apart”(全自动区分计算机和人类的图灵测试)的缩写,是一种区分用户是计算机还是人的公共全自动程序。用户在第三平台上使用时可防止:恶意破解密码、刷票、论坛灌水、身份核实等功能,验证码已成为很多网站/平台通行的方式。因此,基于第三平台并通过验证码技术实现数据样本的识别成为数据识别领域的一大挑战。
发明内容
本发明的发明目的是,针对上述问题,提供一种基于验证码的数据样本识别系统,本发明基于为第三方平台提供验证码服务的途径,通过用户验证码的方式识别语音数据对应的文字样本,从而大量节约成本。
为达到上述目的,本发明所采用的技术方案是:
一种基于验证码的数据样本识别系统,包括用户终端和数据样本识别模块,所述用户终端与数据样本识别模块连接,用以向数据样本识别模块发起校验请求,并显示数据样本识别模块发来的验证码;
所述验证码包括真实校验码和数据样本,所述真实校验码由数据样本识别模块根据调取数据样本的标签生成,用于校验对比,为用户提供验证服务;所述数据样本与真实校验码绑定关联为一体,用于数据采集;
所述真实校验码显示在用户终端上,以使用户根据该真实校验码输入数据样本的识别结果,用户终端将所述识别结果、真实校验码和数据样本关联为一体,生成一识别验证码并发送给数据样本识别模块;
所述数据样本识别模块与用户终端连接,用以接收用户终端的校验请求,所述数据样本识别模块对数据样本识别时,先是接收用户终端发来的识别验证码;然后将该识别验证码依次拆分为数据样本和含有识别结果的真实校验码;接着先对比真实校验码,若正确则将数据样本添加至数据样本标签,并存储该数据样本;反之,若真实校验码错误,则返回错误并丢弃该数据样本;
所述数据样本为图文样本或语音样本。
上述方案中,当所述数据样本为图文样本时,作为优选实施方式,所述数据样本识别模块包括采集服务器和样本数据库,
所述用户终端与采集服务器连接,用于与采集服务器进行信息交互并向采集服务器发起验证请求,同时供用户终端向采集服务器输入待识别样本数据的识别结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国—东盟信息港股份有限公司,未经中国—东盟信息港股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910065908.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





