[发明专利]数据处理学习方法、系统以及电子设备有效
申请号: | 201711128210.9 | 申请日: | 2017-11-14 |
公开(公告)号: | CN107832852B | 公开(公告)日: | 2021-03-02 |
发明(设计)人: | 黄鼎隆;马修·罗伯特·斯科特;傅恺;郭胜 | 申请(专利权)人: | 深圳码隆科技有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 王宁宁 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 学习 方法 系统 以及 电子设备 | ||
本发明提供了一种数据处理学习方法、系统以及电子设备,涉及数据处理技术领域,数据处理学习方法包括:对第一目标数据进行初始数据处理,得到特征数据;通过聚类算法将特征数据中的每个数据类型分为多个数据集合;计算每个数据集合内的特征数据密度,得到密度值;根据密度值将多个数据集合进行排序,得到最大密度值数据集合;根据每个数据类型中的最大密度值数据集合形成数据处理模型;其中,数据处理模型用于对第二目标数据进行初始数据处理,解决了现有技术中存在的自动化等系统在对数据处理规则的学习与训练过程中,会由于各种原始数据中大量的噪声数据而影响对数据处理规则进行学习训练的过程,从而降低学习过程效率的技术问题。
技术领域
本发明涉及数据处理技术领域,尤其是涉及一种数据处理学习方法、系统以及电子设备。
背景技术
数据(Data)是对事实、概念或指令的一种表达形式,可由自动化装置进行处理。数据经过解释并赋予一定的意义之后,便成为信息。数据处理(data processing)是对数据的采集、存储、检索、加工、变换和传输。
目前,数据处理的基本目的是从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。数据处理是系统工程和自动控制的基本环节。数据处理是对数据进行分析和加工的技术过程。数据处理的过程包括对各种原始数据的分析、整理、计算、编辑等的加工和处理,比数据分析含义广。
自动化装置等系统需要对各种原始数据的抽取、存储、检索、加工、变换、推导、传输等数据处理规则进行学习与训练,在对数据处理规则的学习与训练过程中,会由于各种原始数据中大量的噪声数据而影响对数据处理规则进行学习训练的过程,从而降低学习过程的效率。
发明内容
有鉴于此,本发明的目的在于提供一种数据处理学习方法、系统以及电子设备,以解决现有技术中存在的自动化等系统在对数据处理规则的学习与训练过程中,会由于各种原始数据中大量的噪声数据而影响对数据处理规则进行学习训练的过程,从而降低学习过程效率的技术问题。
第一方面,本发明实施例提供了一种数据处理学习方法,包括:
对第一目标数据进行初始数据处理,得到特征数据;
通过聚类算法将所述特征数据中的每个数据类型分为多个数据集合;
计算每个所述数据集合内的特征数据密度,得到密度值;
根据所述密度值将多个所述数据集合进行排序,得到最大密度值数据集合;
根据每个所述数据类型中的所述最大密度值数据集合形成数据处理模型;其中,所述数据处理模型用于对第二目标数据进行初始数据处理。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,所述对第一目标数据进行初始数据处理,得到特征数据,具体包括:
根据数据处理模型对第一目标数据进行特征提取,得到特征数据。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,所述通过聚类算法将所述特征数据中的每个数据类型分为多个数据集合,具体包括:
通过聚类算法将所述特征数据分为若干个数据类型,并将每个所述数据类型中的特征数据分成多个数据集合。
结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,所述根据所述密度值将多个所述数据集合进行排序,得到最大密度值数据集合,具体包括:
根据所述密度值将多个所述数据集合进行从大到小的排序,得到最大密度值数据集合。
结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中,所述根据每个所述数据类型中的所述最大密度值数据集合形成数据处理模型,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳码隆科技有限公司,未经深圳码隆科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711128210.9/2.html,转载请声明来源钻瓜专利网。