[发明专利]深度学习模型构建方法、装置、电子设备及存储介质有效
申请号: | 202110409806.6 | 申请日: | 2021-04-15 |
公开(公告)号: | CN113157183B | 公开(公告)日: | 2022-12-16 |
发明(设计)人: | 王小东;周智杰;吕文勇;刘洪江;廖浩 | 申请(专利权)人: | 成都新希望金融信息有限公司 |
主分类号: | G06F3/0484 | 分类号: | G06F3/0484;G06F3/04817;G06F3/0486;G06F8/41;G06N20/00;G06N3/04 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 唐菲 |
地址: | 610000 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 深度 学习 模型 构建 方法 装置 电子设备 存储 介质 | ||
本申请提供一种深度学习模型构建方法、装置、电子设备及存储介质,涉及深度学习技术领域。该方法包括:确定深度学习模型的框架类型;基于对深度学习模型的多个操作组件的操作指令生成有向无环图;基于所述有向无环图和所述框架类型生成指定深度学习模型;根据所述指定深度学习模型的模型结构对所述指定深度学习模型进行训练。通过深度学习模型的操作组件配置,可以自动生成深度学习模型代码,并配置化进行模型训练,提高深度学习模型的开发效率,进一步降低深度学习模型开发的门槛。
技术领域
本申请涉及深度学习技术领域,具体而言,涉及一种深度学习模型构建方法、装置、电子设备及存储介质。
背景技术
作为机器学习发展到一定阶段的产物,近年来深度学习技术之所以能引起社会各界广泛的关注,是因为不光在学术界,同时也在工业界取得了重大突破和广泛的应用。其中应用最广的几个研究领域分别是自然语言处理、语音识别和图像处理等。深度学习大大提升了计算机视觉、自然语言处理、语音识别的识别能力,因此在工业界得到了大量的应用,各种基于深度学习的应用如井喷式发展,比如面向金融领域的人脸识别,活体识别,身份证OCR(Optical Character Recognition,光学字符识别)识别;面向客服领域的智能客服,人机对话,智能催收;面向工业界的物体缺陷检测;面向安全领域的人脸门禁,高空抛物检测,智慧安防等等都是基于深度学习的应用。
因此,全世界产生了大量的深度学习算法工程师,使用深度学习技术解决现实生活中的各类问题。但是,深度学习的开发框架多种多样,有 Tensorflow、Mxnet、Keras、Pytorch以及PaddlePaddle等,其语法掌握起来有一定的难度,同时业务需求很多,需要快速上线,深度学习算法的识别能力主要取决于网络结构的设计,设计算法就是在设计神经网络结构,网络结构所依赖的底层操作函数各个框架都是一样的,只是需要进行不同的组装而已。深度学习的网络结构也是经常需要展示和研究的,大部分都是代码,从代码很难看到网络结构或者很难快速知道其网络结构如何,因此在深度学习模型开发时需要进行较为复杂的模型架构和配置,需要较为专业的工作人员,同时存在深度学习模型建模和训练效率较低的问题。
发明内容
有鉴于此,本申请实施例的目的在于提供一种深度学习模型构建方法、装置、电子设备及存储介质,以改善现有技术中在深度学习模型开发时需要进行较为复杂的模型架构和配置,导致建模和训练效率较低的问题。
本申请实施例提供了一种深度学习模型构建方法,所述方法包括:确定深度学习模型的框架类型;基于对深度学习模型的多个操作组件的操作指令生成有向无环图;基于所述有向无环图和所述框架类型生成指定深度学习模型;根据所述指定深度学习模型的模型结构对所述指定深度学习模型进行训练。
在上述实现方式中,通过深度学习模型的操作组件配置,可以自动生成深度学习模型代码,用户只需要基于神经网络的基础操作组件,进行组件参数的配置,基于组件组装其神经网络结构,选择一种深度学习框架,便可以自动生成深度学习模型代码,并配置化进行模型训练,由于操作组件和有向无环图等为可视化,进一步降低了深度学习模型开发门槛和复杂性,从而提高了深度学习模型的开发效率。
可选地,所述操作指令包括点击和拖拽,所述基于对深度学习模型的操作组件的操作指令生成有向无环图,包括:监听对所述多个操作组件的点击事件,在所述点击事件触发时获取所述多个操作组件的配置参数;监听所述多个操作组件的拖曳事件,在所述多个操作组件触发拖曳事件时获取所述多个操作组件的节点并计算所有所述节点的父子关系;基于所述父子关系和所述连线操作在所述多个操作组件之间添加连线,以生成所述有向无环图。
在上述实现方式中,通过操作组件的点击事件和拖曳事件确定用户对操作组件的选取和连接操作,自动生成有向无环图,实现了深度学习模型的框架自动生成和配置,从而提高了深度学习模型构建的效率。
可选地,在所述基于对深度学习模型的多个操作组件的操作指令生成有向无环图之前,所述方法还包括:采用图可视化编辑器生成所述深度学习模型中的操作对应的所述多个操作组件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都新希望金融信息有限公司,未经成都新希望金融信息有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110409806.6/2.html,转载请声明来源钻瓜专利网。