[发明专利]深度神经网络模型的构建方法、装置、介质及电子设备有效
申请号: | 201910708892.3 | 申请日: | 2019-08-01 |
公开(公告)号: | CN110428052B | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 陶超;沙韬伟;邓金秋 | 申请(专利权)人: | 江苏满运软件科技有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04;G06F16/35;G06F16/332;G06F16/33 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 210012 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 深度 神经网络 模型 构建 方法 装置 介质 电子设备 | ||
本申请实施例公开了一种深度神经网络模型的构建方法、装置、介质及电子设备。该方法包括:将有标签样本数据输入第一神经网络模型,得到有标签样本数据的特征表示;其中,所述第一神经网络模型根据无标签样本数据对第一神经网络模型的网络结构的参数进行训练得到的;将有标签样本数据的特征表示和标签数据输入第二神经网络模型,以对所述第二神经网络模型的参数进行训练。通过运行本申请所提供的技术方案,可以实现在有标签的训练样本资源有限的情况下,能够保证高质量的模型训练效果,无需消耗大量的人力资源对较多数据进行标注标签的目的。
技术领域
本申请实施例涉及计算机技术领域,尤其涉及一种深度神经网络模型的构建方法、装置、介质及电子设备。
背景技术
随着科技的迅速发展,了解用户的真实意图已经成为智能化的新标准。在对自然语言进行处理的过程中,往往需要构建神经网络模型,以实现对自然语言的文本蕴涵、智能问答、语义相似判断以及文本分类等进行处理,来获取用户的真实意图。
然而,目前的神经网络模型构建过程,往往会存在两方面问题。一方面是如果采用没有标签的数据作为训练样本,则虽然样本数据多,但是训练得到的神经网络模型特征比较泛化,不能够针对特定的问题提供质量较高的输出结果。另一方面是有标签的数据作为训练样本的话,由于数据量比较稀少,获取难度大,则可能会造成对模型的训练不够充分,导致模型的训练效果较差的问题。
发明内容
本申请实施例提供一种深度神经网络模型的构建方法、装置、介质及电子设备,可以实现在有标签的训练样本资源有限的情况下,能够保证高质量的模型训练效果,无需消耗大量的人力资源对较多数据进行标注标签的目的。
第一方面,本申请实施例提供了一种深度神经网络模型的构建方法,该方法包括:
将有标签样本数据输入第一神经网络模型,得到有标签样本数据的特征表示;其中,所述第一神经网络模型根据无标签样本数据对第一神经网络模型的网络结构的参数进行训练得到的;
将有标签样本数据的特征表示和标签数据输入第二神经网络模型,以对所述第二神经网络模型的参数进行训练。
进一步的,将有标签样本数据的特征表示和标签数据输入第二神经网络模型之前还包括:
根据样本数据的标签类型,确定样本数据的任务类型;
根据样本数据的任务类型,确定所述第二神经网络模型的网络结构。
进一步的,对所述第二神经网络模型的参数进行训练之后,还包括:
获取待检测的目标数据,以及目标数据所关联的目标任务类型;
将所述目标数据作为所述第一神经网络模型的输入,得到目标数据的特征表示;
将目标数据的特征表示作为所述目标任务类型所关联经训练的第二神经网络模型,得到目标数据的任务检测结果。
进一步的,所述任务类型包括语义分类类型、语义包含类型、文本相似类型以及多元选择类型中的至少一种。
进一步的,根据样本数据的任务类型,确定所述第二神经网络模型的网络结构,包括:
若所述样本数据的任务类型为语义分类类型,则所述第二神经网络模型的网络结构包括:数据输入层和语义分类数据输出层;
若所述样本数据的任务类型为语义包含类型,则所述第二神经网络模型的网络结构包括:前提信息输入层、假设信息输入层以及包含结果输出层;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏满运软件科技有限公司,未经江苏满运软件科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910708892.3/2.html,转载请声明来源钻瓜专利网。