[发明专利]一种数据处理方法、装置、系统及存储介质在审
| 申请号: | 201911171882.7 | 申请日: | 2019-11-26 |
| 公开(公告)号: | CN111046924A | 公开(公告)日: | 2020-04-21 |
| 发明(设计)人: | 叶年进;王光甫;蒋霆;刘帅成 | 申请(专利权)人: | 成都旷视金智科技有限公司;北京旷视科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 北京市磐华律师事务所 11336 | 代理人: | 高伟 |
| 地址: | 611730 四川省成都市郫县*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据处理 方法 装置 系统 存储 介质 | ||
本发明提供了一种数据处理方法、装置、系统及存储介质,方法包括:从训练集中获取预定数量的训练数据作为当前轮训练数据子集,并基于当前轮训练数据子集对神经网络进行训练,确定当前轮的训练参数,当前轮训练数据子集包括N类训练样本集,N为正整数;根据训练参数确定下一轮训练数据子集中各类训练数据的占比;基于下一轮训练数据子集对神经网络进行训练,得到数据处理模型;利用数据处理模型对待处理数据进行分类,确定待处理数据的分类结果。根据本发明的方法、装置、系统及存储介质,通过计算当前轮训练的训练参数确定下一轮训练数据的各类数据的占比训练得到模型进行数据处理,提高了数据处理的效率和准确性。
技术领域
本发明涉及数据处理技术领域,更具体地涉及图像处理。
背景技术
目前基于深度学学习来进行数据处理应景普遍应用于各个方面,如图像处理中的人脸识别、行为识别等。而深度学习方法往往需要大量的训练数据,但实际应用中我们很可能由于条件限制等原因难以搜集到理想的数据,这时候就会出现所需的各类数据数量不均衡的情况,这对网络的收敛以及最终的效果都会产生影响。除此之外,即使所得数据各类已经达到了均衡,但对于用于数据处理的网络来说,部分类别可能是比较相近、或学习起来是十分困难的,在实际网络训练时,对于这些类别的准确率迟迟无法上升,影响网络的收敛速度,甚至影响网络最后对于这些类别的效果。
因此,现有技术中的数据处理中效率低且准确性不高的问题。
发明内容
考虑到上述问题而提出了本发明。本发明提供了一种数据处理方法、装置、系统及计算机存储介质,通过计算当前轮训练的训练参数确定下一轮训练数据的各类数据的占比训练得到模型进行数据处理,提高了数据处理的效率和准确性。
根据本发明的第一方面,提供了一种数据处理方法,包括:
对神经网络进行训练,得到数据处理模型;
利用所述数据处理模型对待处理数据进行分类,确定所述待处理数据的分类结果;
其中,所述对神经网络进行训练,得到数据处理模型,包括:
从训练集中获取预定数量的训练数据作为当前轮训练数据子集,并基于所述当前轮训练数据子集对所述神经网络进行训练,确定当前轮的训练参数,所述当前轮训练数据子集包括N类训练样本集,N为正整数;
根据所述训练参数确定下一轮训练数据子集中各类训练数据的占比;
基于所述下一轮训练数据子集对所述神经网络进行训练,得到所述数据处理模型。
根据本发明的第二方面,提供了一种数据处理装置,包括:
训练模块,用于对神经网络进行训练,得到数据处理模型;
数据处理模块,用于利用所述数据处理模型对待处理数据进行分类,确定所述待处理数据的分类结果;
其中,所述对神经网络进行训练,得到数据处理模型,包括:
从训练集中获取预定数量的训练数据作为当前轮训练数据子集,并基于所述当前轮训练数据子集对所述神经网络进行训练,确定当前轮的训练参数,所述当前轮训练数据子集包括N类训练样本集,N为正整数;
根据所述训练参数确定下一轮训练数据子集中各类训练数据的占比;
基于所述下一轮训练数据子集对所述神经网络进行训练,得到所述数据处理模型。
根据本发明的第三方面,提供了一种数据处理系统,包括存储器、处理器及存储在所述存储器上且在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现第一方面所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都旷视金智科技有限公司;北京旷视科技有限公司,未经成都旷视金智科技有限公司;北京旷视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911171882.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数字网络接口电路
- 下一篇:一种工业用压力测量仪表





