[发明专利]一种基于关键信息匿名化的智能网联汽车数据训练方法、电子设备及计算机可读存储介质在审
申请号: | 202210452904.2 | 申请日: | 2022-04-27 |
公开(公告)号: | CN114741731A | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 唐照翔;郝金隆 | 申请(专利权)人: | 重庆长安汽车股份有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06V10/96;G06V20/56;G06V40/16;G06V20/62;G06V10/774;G06V10/82;G06N3/08;G06N3/04;G06K9/62;G16Y20/00;G16Y20/20;G16Y20/40;G16Y40/10 |
代理公司: | 重庆博凯知识产权代理有限公司 50212 | 代理人: | 李海华 |
地址: | 400020 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 关键 信息 匿名 智能 汽车 数据 训练 方法 电子设备 计算机 可读 存储 介质 | ||
本发明公开了一种基于关键信息匿名化的智能网联汽车数据训练方法、电子设备及计算机可读存储介质,在云端,先对历史采集的路试数据中的关键信息进行匿名化处理,得到匿名化数据;然后对数据标注,将标注结果数据和匿名化数据一起进行模型训练,得到初版模型并部署至车端;在车端,对车端采集的原始数据进行相同的匿名化处理,得到车端匿名化数据;一方面用于模型预测,将预测结果提供给车端应用;另一方面将车端匿名化数据上传至云端,与云端原有匿名化数据取并集作为新一轮云端训练数据,用于下一次模型迭代,得到迭代模型;将迭代模型推送给车端进行更新。本发明在保证数据隐私传递的同时,不影响模型的预测性能,并解决模型迭代更新的问题。
技术领域
本发明涉及智能网联汽车数据处理技术改进,具体涉及一种基于关键信息匿名化的智能网联汽车数据训练方法,属于数据处理训练技术领域。
背景技术
随着自动驾驶技术在国内的蓬勃发展,各大主机厂商和技术供应商都在努力提升竞争力,提出了各种数据采集和算法训练的方法。例如:(1)浙江吉利控股集团有限公司的CN202210057268数据采集方法、装置、设备及存储介质,提出如下技术:在车辆行驶的过程中,获取车端传感器采集的车端数据以及路端传感器采集的路端数据,对车端数据和路端数据进行时空同步,并根据高精地图对时空同步后的车端数据和路端数据进行融合,得到目标数据,基于目标数据进行场景分类,获得多个场景对应的场景数据,根据场景数据构建自动驾驶场景库。(2)浙江零跑科技有限公司的CN201910454082 L3级自动驾驶系统道路驾驶数据采集、分析及上传方法,提出了如下技术:采集车端驾驶数据,包括驾驶数据的采集与同步及驾驶数据的编码与缓存,对采集到的车端驾驶数据进行在线数据分析,包括自动驾驶系统中间结果输出接口定义、目标匹配一致性检测、定位路标语义输出、极端车辆操作检测及人机决策一致性检测,然后进行数据通信,对车端驾驶数据做好上传准备,最后服务器端接收并存储车端驾驶数据。
因此,越来越多的数据被采集和用于算法训练,以提升自动驾驶的性能,但存在着用户关键信息被泄露的问题。为了保护用户关键信息不被恶意使用,相关部门规定汽车在收集车外的视频、图像数据时,不能直接将未经处理的数据向车外提供,如需向车外提供,则需要在车内对数据中的人脸、车牌信息等进行匿名化处理。因此,如何在保护用户隐私安全的前提下,智能网联汽车合理高效的采集和使用数据成为了一个关键挑战。
现有技术主要是在云端利用匿名化数据进行模型训练,然后在车端利用非匿名数据进行预测,这类技术的一个严重缺点是:利用匿名化数据训练生成的算法模型在非匿名化数据上会产生较大的偏差,云端训练生成的算法模型在量产车实际使用时,性能不稳定。
另外,量产后的网联汽车,其自动驾驶数据的采集、训练和部署未形成算法闭环,降低算法训练和模型迭代的速度。
发明内容
针对现有技术存在的上述不足,本发明的目的是提供一种基于关键信息匿名化的智能网联汽车数据训练方法,本发明在保证数据隐私传递的同时,不影响模型的预测性能,并在此基础上构造出算法闭环,解决模型迭代更新的问题。
本发明的技术方案是这样实现的:
一种基于关键信息匿名化的智能网联汽车数据训练方法,其特征在于:包括如下步骤,
1)初版模型获取;在云端,先对历史采集的路试数据中的关键信息进行匿名化处理,得到云端匿名化数据;然后对路试数据进行标注,得到标注结果数据后和云端匿名化数据一起进行模型训练,得到初版模型,将初版模型部署至车端;
2)车端数据脱敏处理;在车端,对车端实时或历史采集的原始数据中的关键信息采用和云端相同的匿名化处理,得到车端匿名化数据;
3)车端模型预测:利用部署至车端的初版模型对车端匿名化数据进行模型预测,将预测结果提供给车端应用;
4)云端数据更新;将车端匿名化数据上传至云端,与原有云端匿名化数据取并集并标注作为新一轮云端训练数据,用于下一次模型迭代;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆长安汽车股份有限公司,未经重庆长安汽车股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210452904.2/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置