[发明专利]一种数据挖掘处理系统在审
| 申请号: | 201910607248.7 | 申请日: | 2019-07-07 |
| 公开(公告)号: | CN110334128A | 公开(公告)日: | 2019-10-15 |
| 发明(设计)人: | 宋顶利;张昕;周建新 | 申请(专利权)人: | 华北理工大学 |
| 主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/28;G06N5/02 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 063210 河北省唐山*** | 国省代码: | 河北;13 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 处理系统 数据挖掘 数据归一化模块 数据采样模块 数据分类模块 数据关联规则 数据特征提取 数据挖掘模块 归一化处理 采样结果 分类处理 关联规则 生成模块 特征矩阵 同类数据 有效数据 数据处理 采样 挖掘 改进 | ||
本发明公开了一种数据挖掘处理系统,包括数据采样模块,用于对待处理的数据进行采样;数据分类模块,根据采样结果对数据进行分类处理;数据特征提取模块,用于对每一类数据进行特征矩阵提取;数据归一化模块,用于对每一类数据进行归一化处理;数据关联规则生成模块,用于建立不同类数据之间的关联规则;数据挖掘模块,用于挖掘有效数据。本发明能够改进现有技术的不足,提高了数据处理的效率。
技术领域
本发明涉及大数据技术领域,尤其是一种数据挖掘处理系统。
背景技术
数据挖掘是指在海量的数据中检索到有价值数据信息的过程。由于待处理数据量庞大,如何降低数据挖掘过程的运算量,提高处理效率成为了这一领域研究的重点。
发明内容
本发明要解决的技术问题是提供一种数据挖掘处理系统,能够解决现有技术的不足,提高了数据处理的效率。
为解决上述技术问题,本发明所采取的技术方案如下。
一种数据挖掘处理系统,包括,
数据采样模块,用于对待处理的数据进行采样;
数据分类模块,根据采样结果对数据进行分类处理;
数据特征提取模块,用于对每一类数据进行特征矩阵提取;
数据归一化模块,用于对每一类数据进行归一化处理;
数据关联规则生成模块,用于建立不同类数据之间的关联规则;
数据挖掘模块,用于挖掘有效数据。
一种上述的数据挖掘处理系统的处理方法,包括以下步骤:
A、数据采样模块对待处理的数据进行采样;
B、根据采样结果,数据分类模块对数据进行分类处理;
C、数据特征提取模块对每一类数据进行特征矩阵提取;
D、数据归一化模块对每一类数据进行归一化处理;
E、数据关联规则生成模块建立不同类数据之间的关联规则;
F、数据挖掘模块对有效数据进行挖掘。
作为优选,步骤B中,对数据进行分类包括以下步骤,
B1、根据采样结果,确定数据类别;
B2、提取每一个数据类别的特征量,作为第一特征量;
B3、使用第一特征量对待处理数据进行遍历,对数据进行分类。
作为优选,步骤C中,特征矩阵提取包括以下步骤,
C1、对同一类数据以第一特征量为初始量进行特征迭代处理;
C2、对特征迭代过程出现的新的特征量进行记录,作为第二特征量;
C3、将第一特征量作为特征矩阵的第一列元素,同类数据的第一特征量和第二特征量位于特征矩阵的同一行。
作为优选,步骤D中,对数据进行归一化处理包括以下步骤,
D1、通过变换矩阵对特征矩阵进行处理,得到归一化矩阵;变换矩阵每一行有且只有一个非零元素,所述非零元素为每一类数据中第一特征量和第二特征量的最大特征权重值;
D2、使用归一化矩阵对数据进行归一化处理。
作为优选,步骤E中,不同类数据之间的关联规则包括强关联规则和弱关联规则,强关联规则为关联映射唯一确定的关联规则,弱关联规则包括一组关联映射集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华北理工大学,未经华北理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910607248.7/2.html,转载请声明来源钻瓜专利网。





