[发明专利]任务处理模型训练、任务处理方法、装置及设备在审
申请号: | 202111319455.6 | 申请日: | 2021-11-09 |
公开(公告)号: | CN116109853A | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | 方建生 | 申请(专利权)人: | 广州视源电子科技股份有限公司;广州视源人工智能创新研究院有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V40/16;G06V10/82;G06N3/0464;G06N3/084 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张娜;刘芳 |
地址: | 510530 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 任务 处理 模型 训练 方法 装置 设备 | ||
本申请提供一种任务处理模型训练、任务处理方法、装置及设备。该任务处理模型训练方法包括:获取训练数据集,训练数据集中包括多个训练数据,每个训练数据对应有标签,标签与用户需求的任务处理模型所具备的功能相关;使用训练数据集对预设模型进行迭代训练,得到任务处理模型;预设模型在第i次迭代训练时所使用的权重分布矩阵,为对预设模型在第i‑1次迭代训练时基于梯度下降法更新后的权重分布矩阵进行调整得到的,任务处理模型用于进行目标任务的处理,目标任务为用户需求的任务处理模型所具备的功能,i为大于或等于2的整数;输出任务处理模型。本申请的方法减少了训练得到的任务处理模型的过拟合现象,提高了任务处理模型的预测准确度。
技术领域
本申请涉及人工智能技术,尤其涉及一种任务处理模型训练、任务处理方法、装置及设备。
背景技术
贝叶斯卷积神经网络由于不确定性估计的特性,在很多领域都有所应用。
贝叶斯卷积神经网络是在卷积神经网络的卷积层中应用贝叶斯方法,将卷积层的权重参数表示为概率分布,这种概率分布能够很好地表达不确定性的预测结果。贝叶斯卷积神经网络的训练过程与普通神经网络的训练过程类似,首先确定一目标函数,并基于每次迭代训练得到的结果与标签确定目标函数值,再根据目标函数值调整本次迭代训练的权重参数,直至训练结束,得到训练好的模型。
然而,这种训练方法会导致训练好的模型存在过拟合现象,进而导致训练好的模型的预测准确度较低。
发明内容
本申请提供一种任务处理模型训练、任务处理方法、装置及设备,用以解决现有的对贝叶斯卷积神经网络的训练方法中训练好的模型存在过拟合现象,进而导致训练好的模型的预测准确度较低的问题。
第一方面,本申请提供一种任务处理模型训练方法,包括:获取训练数据集,所述训练数据集中包括多个训练数据,每个训练数据对应有标签,所述标签与用户需求的任务处理模型所具备的功能相关;使用所述训练数据集对预设模型进行迭代训练,得到任务处理模型;所述预设模型在第i次迭代训练时所使用的权重分布矩阵,为对所述预设模型在第i-1次迭代训练时所使用的权重分布矩阵进行调整得到的,所述任务处理模型用于进行目标任务的处理,所述目标任务为用户需求的所述任务处理模型所具备的功能,其中,所述i为大于或等于2的整数;输出所述任务处理模型。
第二方面,本申请提供一种任务处理方法,包括:接收待处理任务对应的图像;将所述待处理任务对应的图像输入基于第一方面所述的任务处理模型训练方法得到的任务处理模型中,得到任务处理结果;输出所述任务处理结果。
第三方面,本申请提供一种任务处理模型训练装置,包括:获取模块,用于获取训练数据集,所述训练数据集中包括多个训练数据,每个训练数据对应有标签,所述标签与用户需求的任务处理模型所具备的功能相关;训练模块,用于使用所述训练数据集对预设模型进行迭代训练,得到任务处理模型;所述预设模型在第i次迭代训练时所使用的权重分布矩阵,为对所述预设模型在第i-1次迭代训练时所使用的权重分布矩阵进行调整得到的,所述任务处理模型用于进行目标任务的处理,所述目标任务为用户需求的所述任务处理模型所具备的功能,其中,所述i为大于或等于2的整数;输出模块,用于输出所述任务处理模型。
第四方面,本申请提供一种任务处理装置,包括:接收模块,用于接收待处理任务对应的图像;输入模块,用于将所述待处理任务对应的图像输入基于第一方面所述的任务处理模型训练方法得到的任务处理模型中,得到任务处理结果;输出模块,用于输出所述任务处理结果。
第五方面,本申请提供一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;所述存储器存储计算机执行指令;所述处理器执行所述存储器存储的计算机执行指令,以实现如第一方面所述的方法。
第六方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如第一方面所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司;广州视源人工智能创新研究院有限公司,未经广州视源电子科技股份有限公司;广州视源人工智能创新研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111319455.6/2.html,转载请声明来源钻瓜专利网。