[发明专利]一种基于大数据的计算机数据挖掘探索方法及系统在审
申请号: | 201910811174.9 | 申请日: | 2019-08-30 |
公开(公告)号: | CN110750583A | 公开(公告)日: | 2020-02-04 |
发明(设计)人: | 李卫群;张涛;陆苇;雷厚宇;兰海翔 | 申请(专利权)人: | 贵州力创科技发展有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/28;G06F16/951 |
代理公司: | 11212 北京轻创知识产权代理有限公司 | 代理人: | 赵秀斌 |
地址: | 560003 贵州省贵阳市贵阳国家高*** | 国省代码: | 贵州;52 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 大数据 数据仓库 数据挖掘 挖掘 数据挖掘工具 数据挖掘模型 支持向量机 模式查询 数据探索 遗传算法 预处理 计算机数据挖掘 抓取 采集计算机 全量抽取 网络爬虫 有效信息 增量抽取 探索 构建 加载 铺垫 转换 分析 | ||
本发明涉及一种基于大数据的计算机数据挖掘探索方法及系统,其方法包括以下步骤,采集计算机数据,形成原始大数据;对原始大数据进行预处理,并存入数据仓库;基于支持向量机、模式查询和数据挖掘工具构建数据挖掘模型,并利用数据挖掘模型在数据仓库中进行数据挖掘;得到挖掘数据;基于遗传算法对挖掘数据进行探索分析,得到挖掘探索信息。本发明采用网络爬虫抓取数据的方式进行数据的收集整理,采用数据的全量抽取和增量抽取的方式进行数据的提取、转换、加载并存入数据仓库供数据挖掘和数据探索作铺垫,并利用支持向量机、模式查询和数据挖掘工具进行数据挖掘,以及利用遗传算法进行数据探索,可以全面高效的挖掘出大数据中的有效信息。
技术领域
本发明涉及大数据领域,具体涉及一种基于大数据的计算机数据挖掘探索方法及系统。
背景技术
对于大数据,往往不能直接读取其中隐含的信息,也不容易从大量的信息中看出某个事物的发展趋势;这样数据挖掘就应运而生,数据挖掘是人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,作出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,作出正确的决策。然而,传统的数据处理方法是人工数据处理。虽然这种方法很容易实现,但是数据挖掘不够全面且效率低。
发明内容
本发明所要解决的技术问题是提供一种基于大数据的计算机数据挖掘探索方法及系统,可以全面高效的挖掘出大数据中的有效信息。
本发明解决上述技术问题的技术方案如下:一种基于大数据的计算机数据挖掘探索方法,包括以下步骤,
S1,采集计算机数据,形成原始大数据;
S2,对所述原始大数据进行预处理,并存入数据仓库;
S3,基于支持向量机、模式查询和数据挖掘工具构建数据挖掘模型,并利用所述数据挖掘模型在所述数据仓库中进行数据挖掘;得到挖掘数据;
S4,基于遗传算法对所述挖掘数据进行探索分析,得到与与所述原始大数据相关联的挖掘探索信息。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述S1具体为,利用网络爬虫实时收集整理计算机数据,形成原始大数据。
进一步,所述S2具体为,对所述原始大数据进行去噪和归一化处理,并存入数据仓库。
进一步,利用所述数据挖掘模型在所述数据仓库中进行数据挖掘的具体步骤为,通过支持向量机对所述数据仓库中的大数据进行分类,结合Sql查询、交互查询和搜索查询的方式并利用数据挖掘工具在分类后的大数据中进行挖掘。
本发明的有益效果是:本发明采用网络爬虫抓取数据的方式进行数据的收集整理;其次,采用数据的全量抽取和增量抽取的方式进行数据的提取、转换、加载并存入数据仓库供数据挖掘和数据探索作铺垫,并利用支持向量机、模式查询和数据挖掘工具进行数据挖掘,以及利用遗传算法进行数据探索,可以全面高效的挖掘出大数据中的有效信息。
基于上述一种基于大数据的计算机数据挖掘探索方法,本发明还提供一种基于大数据的计算机数据挖掘探索系统。
一种基于大数据的计算机数据挖掘探索系统,包括以下模块,
采集模块,其用于采集计算机数据,形成原始大数据;
数据仓库模块,其用于对所述原始大数据进行预处理,并存入数据仓库;
数据挖掘模块,其用于基于支持向量机、模式查询和数据挖掘工具构建数据挖掘模型,并利用所述数据挖掘模型在所述数据仓库中进行数据挖掘;得到挖掘数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州力创科技发展有限公司,未经贵州力创科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910811174.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据处理方法、装置和系统
- 下一篇:数据管理方法和系统