[发明专利]一种数据处理方法、神经网络的训练方法以及相关设备在审
| 申请号: | 202010957768.3 | 申请日: | 2020-09-11 |
| 公开(公告)号: | CN114254724A | 公开(公告)日: | 2022-03-29 |
| 发明(设计)人: | 许封元;吴昊;田雪津;陶喆;曹建龙 | 申请(专利权)人: | 华为技术有限公司;南京大学 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06K9/62;G06N3/08 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 518129 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据处理 方法 神经网络 训练 以及 相关 设备 | ||
本申请实施例公开一种数据处理方法,该方法可用于人工智能的序列数据处理领域。方法包括:通过第一神经网络对第一序列数据携带的信息进行删减处理,得到第二序列数据,第二序列数据携带的信息量小于第一序列数据携带的信息量;将第二序列数据发送给第二执行设备,接收第二执行设备发送的第二序列数据的预测结果,第二序列数据的预测结果被视为第一序列数据的预测结果;第一神经网络为通过第一损失函数和第二损失函数训练得到的,第一损失函数指示第二序列数据携带的信息量,第二损失函数指示第一序列数据的预测结果与第一序列数据的正确结果之间的相似度。减少发送至服务器的信息量,以减少处于风险状态的数据,提高用户数据的安全性。
技术领域
本申请涉及人工智能领域,尤其涉及一种数据处理方法、神经网络的训练方法以及相关设备。
背景技术
人工智能(Artificia1 Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
为了使普通用户可以方便地使用人工智能技术,一些公司提供了线上推理服务。具体的,服务提供商为某特定任务训练好一个神经网络,将训练好的神经网络部署在云端服务器上,用户使用推理服务时只需将待处理数据发送至云端服务器,就可以从服务器处接收到与待处理数据对应的预测结果。
线上推理服务能够避免对第一执行设备的计算机资源的消耗,有利于提升用户的体验,但由于需要将待处理数据发送至云端服务器,会给用户的数据安全带来风险。
发明内容
本申请实施例提供了一种数据处理方法、神经网络的训练方法以及相关设备,减少发送至服务器的信息量,以减少处于风险状态的数据,提高用户数据的安全性;且第一损失函数指示第二序列数据携带的信息量,第二损失函数指示预测结果和正确结果之间的相似度,也即尽量降低由于减少信息量给预测结果的准确率造成的影响。
为解决上述技术问题,本申请实施例提供以下技术方案:
第一方面,本申请实施例提供一种数据处理方法,可用于人工智能的序列数据处理领域中。方法包括:第一执行设备将第一序列数据输入第一神经网络,以通过第一神经网络对第一序列数据携带的信息进行删减处理,得到第二序列数据,第二序列数据携带的信息量小于第一序列数据携带的信息量,第二序列数据也可以视为对第一序列数据进行过隐私处理之后的序列数据。若第一序列数据和第二序列数据中携带的均为图像数据的信息,则第一序列数据和第二序列数据携带的信息量均可以通过图片的熵值来衡量;图片熵是一个在图像处理领域广泛应用的定义,可以用来衡量一个图片中包含的信息量。第一执行设备将第二序列数据发送给第二执行设备,第二序列数据用于指示第二执行设备将第二序列数据输入至第二神经网络中,以通过第二神经网络生成第二序列数据的预测结果。其中,第二神经网络和第一神经网络的任务目标不同,第一神经网络的任务目标为对序列数据中携带的信息量进行删减,也即对序列数据进行预处理;第二神经网络的任务目标为生成序列数据的预测结果。第一执行设备接收第二执行设备发送的第二序列数据的预测结果,第二序列数据的预测结果被视为第一序列数据的预测结果。其中,第一神经网络为通过第一损失函数和第二损失函数训练得到的,第一损失函数指示第二序列数据携带的信息量;第二损失函数指示第一序列数据的预测结果与第一序列数据的正确结果之间的相似度,也即第二损失函数指示第二序列数据的预测结果与第一序列数据的正确结果之间的相似度。
本实现方式中,通过上述方式,能够减少发送至服务器的信息量,以减少处于风险状态的数据,从而提高用户数据的安全性;且第一神经网络是通过第一损失函数和第二损失函数训练得到的,第一损失函数指示第二序列数据携带的信息量,第二损失函数指示预测结果和正确结果之间的相似度,也即在减少发送至服务器的信息量的同时,尽量降低由于减少信息量给预测结果的准确率造成的影响。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司;南京大学,未经华为技术有限公司;南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010957768.3/2.html,转载请声明来源钻瓜专利网。





