[发明专利]一种机器学习引擎的研究方法在审
| 申请号: | 201911202775.6 | 申请日: | 2019-11-29 |
| 公开(公告)号: | CN110942155A | 公开(公告)日: | 2020-03-31 |
| 发明(设计)人: | 陆冰芳;张希翔;梁仲峰;谢菁;韦宗慧 | 申请(专利权)人: | 广西电网有限责任公司 |
| 主分类号: | G06N20/20 | 分类号: | G06N20/20;G06F8/20 |
| 代理公司: | 重庆飞思明珠专利代理事务所(普通合伙) 50228 | 代理人: | 李宁 |
| 地址: | 530012 广西*** | 国省代码: | 广西;45 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 机器 学习 引擎 研究 方法 | ||
本发明公开了一种机器学习引擎的研究方法,包括如下步骤:S1、向用户提供基于交互式学习技术的建模框架,支持图形化方式进行建模挖掘;S2、集成Spark等3种以上机器学习框架,内置分类、回归、聚类、关联规则等多种算法;S3、深度学习是机器学习中一种基于对数据进行表征学习的方法;S4、基于公司信息系统的运行数据,研究机器学习、深度学习算法在信息系统运行监测、信息设备故障诊断、系统安全风险预测、信息用户行为分析预测等方面的应用;本发明降低建模编程技术门槛,使公司业务部门轻松地获得模型训练能力,助力公司大数据的价值发现。研究并构建信息系统安全风险预测模型,实现信息系统运行风险快速实时预测的目的。
技术领域
本发明属于机器学习引擎的研究技术领域,更具体地说,尤其涉及一种机器学习引擎的研究方法。
背景技术
现有的机器学习引擎不具有统一建模框架,建模编程技术门槛,使得模型训练开展难度较大,且机器学习引擎的软件的信息系统安全风险无法进行快速实时预测,为此我们推出一种机器学习引擎的研究方法。
发明内容
本发明的目的是为了解决现有技术中存在的缺点,而提出的一种机器学习引擎的研究方法。
为实现上述目的,本发明提供如下技术方案:
一种机器学习引擎的研究方法,包括如下步骤:
S1、研究交互式机器学习引擎,向用户提供基于交互式学习技术的建模框架,支持图形化方式进行建模挖掘,可以降低编程技术门槛,使用户轻松地获得模型训练能力,助力用户大数据的价值发现;
S2、集成Spark等3种以上机器学习框架,内置分类、回归、聚类、关联规则等多种算法;支持新增自定义算法;
S3、深度学习是机器学习中一种基于对数据进行表征学习的方法,其主要应用方式在于建立、模拟人脑进行分析学习的神经网络,模仿人脑的机制来解释数据,如图像,声音和文本;
研究深度学习在电网运行监测、电力系统自动故障检测、电力设备故障诊断等方面的应用,通过深度学习的方式减少简单重复劳动力投入、自动检测和预测设备故障,助力公司的日常生产和运营;
S4、基于公司信息系统的运行数据,研究机器学习、深度学习算法在信息系统运行监测、信息设备故障诊断、系统安全风险预测、信息用户行为分析预测等方面的应用;研究并构建信息系统安全风险预测模型,并保证其可扩展性、精确性和客观性,实现信息系统运行风险快速实时预测的目的。
优选的,提供的软件应是确保系统正常运行所需的管理、运营、维护等有关的全部软件,并是成熟的最新版本的软件系统,应为模块化设计,保证任何软件模块的维护和更新都不影响其它软件模块,软件具有容错能力。
优选的,提供的软件支持各种硬件厂商机器和Linux系列操作系统平台,全面支持64位能力;开发客户端支持Web客户端,支持PC、手机终端展现;
软件的运行方式支持分布式环境,支持Hadoop和Spark环境,包括Spark、SparkSreaming、Python、R语言等计算组件;
软件支持业务不中断扩容。
优选的,软件的功能包括:
(1)支持拖拽式方式进行交互式探索分析、机器学习、深度学习;
(2)支持机器学习算法开发平台,集成Spark等3种以上机器学习框架;
(3)支持分类、回归、聚类、关联规则、数据预处理、推荐、特征提取、特征转换、特征选择等算法,数据挖掘算法应达到50种以上;
(4)支持新增自定义算法,平台易用性、扩展性较好;
(5)支持模型集成和自动建模功能,对算法结果准确性的分析功能;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西电网有限责任公司,未经广西电网有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911202775.6/2.html,转载请声明来源钻瓜专利网。





