[发明专利]一种数据清洗方法、装置、设备及存储介质在审
申请号: | 201910432391.7 | 申请日: | 2019-05-23 |
公开(公告)号: | CN110297919A | 公开(公告)日: | 2019-10-01 |
发明(设计)人: | 缪慧 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
主分类号: | G06F16/51 | 分类号: | G06F16/51;G06F16/215;G06K9/00 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 刘挽澜 |
地址: | 518052 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标标识 脚本配置 业务数据 自动化脚本 处理业务 存储介质 目标数据 人脸影像 数据清洗 数据库 人工智能技术 参数信息 目标函数 人脸比对 人脸识别 预置算法 冗余 函数库 预置 调用 删除 筛选 | ||
1.一种数据清洗方法,其特征在于,包括:
获取业务数据,所述业务数据包括人脸影像;
根据所述业务数据和预置算法筛选出待处理业务数据;
确定需要使用到的目标函数的目标标识;
生成脚本配置信息,所述脚本配置信息中包括所述目标标识和与所述目标标识对应的参数信息;
根据所述脚本配置信息从函数库中调用与所述目标标识对应的函数,并生成自动化脚本;
通过所述自动化脚本对所述待处理业务数据进行人脸识别;
确定不符合预置要求的目标数据;
将所述目标数据进行删除。
2.根据权利要求1所述的数据清洗方法,其特征在于,所述通过所述自动化脚本对所述待处理业务数据进行人脸识别包括:
通过所述自动化脚本对所述待处理业务数据进行活体检测;
通过所述自动化脚本对所述待处理业务数据进行人证比对。
3.根据权利要求2所述的数据清洗方法,其特征在于,所述通过所述自动化脚本对所述待处理业务数据进行活体检测包括:
通过所述自动化脚本调用活体检测接口;
通过所述活体检测接口判断所述待处理业务数据是否包含人脸影像;
若所述待处理业务数据中包含人脸影像,则获取所述活体检测接口的检测参数值;
判断所述检测参数值是否大于预设的阈值;
若所述检测参数值大于或等于预设的阈值,则确定所述待处理业务数据为有效数据;
若所述检测参数值小于预设的阈值,则确定所述待处理业务数据为无效数据。
4.根据权利要求2所述的数据清洗方法,其特征在于,所述通过所述自动化脚本对所述待处理业务数据进行人证比对包括:
通过所述自动化脚本调用人证比对接口;
通过所述人证比对接口调用数据库中预置的证件照片;
判断所述待处理业务数据和所述证件照片是否属于同一人;
若所述待处理业务数据和所述证件照片属于同一人,则确定所述待处理业务数据为真实数据;
若所述待处理业务数据和所述证件照片不属于同一人,则确定所述待处理业务数据为虚假数据。
5.根据权利要求1-4中任一所述的数据清洗方法,其特征在于,所述确定不符合预置要求的目标数据包括:
若所述待处理业务数据为无效数据或虚假数据,则确定所述待处理业务数据为目标数据,所述目标数据为不符合预置要求的数据。
6.根据权利要求1-4中任一所述的数据清洗方法,其特征在于,所述方法还包括:
配置所述自动化脚本的开始运行时刻和运行持续时长。
7.根据权利要求1-4中任一所述的数据清洗方法,其特征在于,所述根据所述业务数据和预置算法筛选出待处理业务数据包括:
通过预置的特征识别算法和预置的相似度匹配算法对数据库中的业务数据进行筛选;
筛选出问题数据,所述问题数据为不可识别的数据;
将所述问题数据从所述业务数据中删除,得到待处理业务数据。
8.一种数据清洗装置,其特征在于,包括:
获取单元,用于获取业务数据,所述业务数据包括人脸影像;
筛选单元,用于根据所述业务数据和预置算法筛选出待处理业务数据;
第一确定单元,用于确定需要使用到的目标函数的目标标识;
第一生成单元,用于生成脚本配置信息,所述脚本配置信息中包括所述目标标识和与所述目标标识对应的参数信息;
第二生成单元,用于根据所述脚本配置信息从函数库中调用与所述目标标识对应的函数,并生成自动化脚本;
识别单元,用于通过所述自动化脚本对所述待处理业务数据进行人脸识别;
第二确定单元,用于确定不符合预置要求的目标数据;
删除单元,用于将所述目标数据进行删除。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910432391.7/1.html,转载请声明来源钻瓜专利网。