[发明专利]数据预处理方法、设备和存储介质在审
申请号: | 201810581469.7 | 申请日: | 2018-06-07 |
公开(公告)号: | CN110580185A | 公开(公告)日: | 2019-12-17 |
发明(设计)人: | 陈小强 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | G06F9/448 | 分类号: | G06F9/448 |
代理公司: | 11308 北京元本知识产权代理事务所 | 代理人: | 金海荣 |
地址: | 广东省深圳市南山区高*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据预处理 预处理脚本 数据输出路径 数据输入路径 配置文件 原始数据 程序脚本 存储介质 结果保存 数据驱动 未处理 轮询 预设 标准化 监测 检测 语言 | ||
本发明实施例公开了一种数据预处理方法、设备和存储介质,属于数据预处理领域。其中,该方法包括:监测原始数据所在的路径;当检测到存在未处理的原始数据后,根据配置文件中预设的各个步骤执行顺序,执行各个步骤对应的预处理脚本或程序;其中,配置文件中预设有数据预处理的所有步骤及其执行顺序、各个步骤对应的数据输入路径、数据输出路径、以及预处理脚本或程序。本发明实施例通过将各个步骤进行标准化,各个步骤之间由数据驱动,由预处理脚本或程序从数据输入路径读取数据,将生成的结果保存到数据输出路径,从而能适用各种各样数据及各种程序脚本语言,同时,也无需用户轮询各步骤的执行结果,减少了各个步骤之间执行结果的等待。
技术领域
本发明涉及数据预处理领域,特别涉及一种人工智能的数据预处理方法、设备和存储介质。
背景技术
人工智能模型训练需要的训练数据来源众多,数据文件格式各种各样,数据内容五花八门、数据处理的脚本或者程序也各不相同,必须经过预处理后,才能用于人工智能模型训练。不同任务(人脸、人形、车辆),不同算法,比如在人脸识别,MTCNN(Multi-taskconvolutional neural networks,将多任务级联卷积神经网络)需要编写不同的预处理脚本、所需要的预处理步骤也不相同、脚本运行的时间有长有短。
目前,数据预处理聚焦在具体一个步骤,着眼在文件格式、不同字段类型的自动化处理,对预处理各个步骤没有标准化,各个步骤之间基本是手工运行,针对处理耗时较长的步骤,还需要人工轮询查看生成结果,下一个步骤需要等待上一个步骤预处理输出的中间数据。
发明内容
有鉴于此,本发明实施例的目的在于提供一种数据预处理方法、设备和存储介质,以解决对预处理各个步骤没有标准化,各个步骤之间基本是手工运行,针对处理耗时较长的步骤,还需要人工轮询查看生成结果的技术问题。
本发明解决上述技术问题所采用的技术方案如下:
根据本发明实施例的一个方面,提供的一种数据预处理方法包括:
监测原始数据所在的路径;
当检测到存在未处理的原始数据后,根据配置文件中预设的各个步骤执行顺序,执行各个步骤对应的预处理脚本或程序;
其中,所述配置文件中预设有数据预处理的所有步骤及其执行顺序、各个步骤对应的数据输入路径、数据输出路径、以及预处理脚本或程序。
根据本发明实施例的另一个方面,提供给的一种数据预处理设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,该所述计算机程序被所述处理器执行时,实现上述数据预处理方法的步骤。
根据本发明实施例的再一个方面,还提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现上述数据预处理方法的步骤。
本发明实施例的数据预处理方法、设备和存储介质,通过将各个步骤的执行任务的脚本或程序当作黑盒,每个黑盒接收预处理脚本或程序、数据输入路径、以及数据输出路径。各个步骤之间由数据驱动,由预处理脚本或程序从数据输入路径读取数据,将生成的结果保存到数据输出路径,从而实现标准化,能适用各种各样数据及各种程序脚本语言。同时,无需用户轮询各步骤的执行结果,减少了步骤间的等待。
附图说明
图1为本发明实施例一提供的一种数据预处理方法的流程图;
图2为本发明实施例一提供的一种配置文件的示意图;
图3为本发明实施例二提供的一种数据预处理方法的流程图;
图4为本发明实施例三提供的一种人脸识别预处理方法的流程图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810581469.7/2.html,转载请声明来源钻瓜专利网。