[发明专利]数据处理方法、装置、电子设备及存储介质有效
申请号: | 201810866737.X | 申请日: | 2018-08-01 |
公开(公告)号: | CN109189767B | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 康丽萍 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06K9/62;G06Q10/06;G06Q50/12 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 电子设备 存储 介质 | ||
本公开的数据处理方法,属于计算机技术领域,解决现有技术中采用人工方法进行数据处理成本高、效率低的问题。本公开实施例的数据处理方法包括:基于训练数据训练目标模型;通过所述目标模型对测试数据进行预测,确定所述目标模型的预测准确率;通过所述目标模型对所述训练数据进行预测,确定每条所述训练数据的预测标签和预测结果置信度;根据所述训练数据的预置标签、预测标签和预测结果置信度,以及所述预测准确率,对所述训练数据进行处理。本公开提供的数据处理方法通过基于测试数据确定目标模型的预测准确率,并结合目标模型的预测准确率和训练数据的预测结果置信度对训练数据进行处理,有助于提升数据处理效率和准确性,降低数据处理成本。
技术领域
本公开涉及计算机技术领域,特别是涉及一种数据处理方法、装置、电子设备及存储介质。
背景技术
基于训练得到的模型进行分类识别是目前对象分类的常用手段,其中,对象包括但不限于图像、用户行为以及商户等。以酒旅平台的酒店图像质量分类为例,通常是首先基于人工标定了图向质量等级标签的酒店图像训练酒店图像质量分类模型,然后,再基于训练好的酒店图像质量分类模型对目标酒店图像进行分类识别,以确定所述目标酒店图像的质量等级。现有技术中基于训练数据训练分类模型,并基于训练得到的分类模型对对象进行分类识别的应用中,训练数据质量的好坏直接影响训练得到的分类模型的分类准确率,因此,需要提供一种改善训练数据的方案。
发明内容
本公开提供一种数据处理方法,有助于提升数据处理效率和准确性,并降低数据处理成本。
第一方面,本公开实施例提供了一种数据处理方法包括:
基于训练数据训练目标模型,其中,所述训练数据包括预置标签;
通过所述目标模型对测试数据进行预测,确定所述目标模型的预测准确率;
通过所述目标模型对所述训练数据进行预测,确定每条所述训练数据的预测标签和预测结果置信度;
根据所述训练数据的预置标签、预测标签和预测结果置信度,以及所述预测准确率,对所述训练数据进行处理。
第二方面,本公开实施例提供了一种数据处理装置,包括:
目标模型训练模块,用于基于训练数据训练目标模型,其中,所述训练数据包括预置标签;
模型预测准确率确定模块,用于通过所述目标模型对测试数据进行预测,确定所述目标模型的预测准确率;
训练数据预测模块,用于通过所述目标模型训练模块训练的目标模型对所述训练数据进行预测,确定每条所述训练数据的预测标签和预测结果置信度;
数据处理模块,用于根据所述训练数据的预置标签、预测标签和预测结果置信度,以及所述预测准确率,对所述训练数据进行处理。
第三方面,本公开实施例还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本公开实施例所述的数据处理方法。
第四方面,本公开实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时本公开实施例中所述的数据处理方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810866737.X/2.html,转载请声明来源钻瓜专利网。