[发明专利]基于DSP芯片与量化模型的三维物体识别方法有效
申请号: | 201911018559.6 | 申请日: | 2019-10-24 |
公开(公告)号: | CN110991229B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 王资;朝红阳 | 申请(专利权)人: | 中山大学 |
主分类号: | G06V20/64 | 分类号: | G06V20/64;G06V10/94;G06V10/82;G06N3/0464;G06N3/048;G06N3/084 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 王晓玲 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 dsp 芯片 量化 模型 三维 物体 识别 方法 | ||
1.一种基于DSP芯片与量化模型的三维物体识别方法,其特征在于,包括三维数据采集器、三维数据特征提取器以及特征解码器,所述的三维数据特征提取器包括量化参数模型存储模块和DSP并行计算加速模块;所述的三维数据采集器为RGB-D摄像头,拍摄后得到画面中物体的深度信息,最终合成为点云数据;将该点云数据输入到三维数据特征提取器中,特征提取器中的量化参数模型存储模块用于存量化模型的储参数,利用DSP并行计算加速模块加速特性,快速完成深度神经网络中卷积、池化、残差操作,最后得到输入数据的特征;特征解码器根据模型训练时对特征加密的方式反向解码,得到需要的特征格式;
其中,在使用量化参数模型存储模块存储参数时,需要获取量化模型,量化模型的获取方法包括训练时量化和训练后量化;
当为训练时量化是的步骤包括:首先,在模型训练时调用Tensorflow的tf.contrib.quantize.create_training_graph接口并实现该接口未支持的在一般操作后加入伪量化节点的功能,之后所有的运算操作后都有一个伪量化节点,伪量化节点储存上一个节点的最大值和最小值,使用这两个值,利用映射公式:Q=R/scale+zero_pt,即可将参数由32位浮点数存储的方式转换成用8位整型数的存储方式,其中R代表32位浮点数,Q代表8位整型数,scale是映射缩放,scale=(Vmax-Vmin)/255,zero_pt是映射零点,zero_pt=-255*Vmin/(Vmax–Vmin)=-Vmin/scale,其中Vmax与Vmin从伪量化节点中获取,255为8位无符号整型数可表示的最大值;
然后,在模型参数固定时,调用tf.contrib.quantize.create_eval_graph接口并实现该接口未支持的在一般操作后加入伪量化节点的功能;随后进行模型参数固定,参数固定后,调用toco convert脚本,结合一般节点与其对应的伪量化节点的信息,得到量化模型;
当为训练后量化时的步骤包括:首先,在模型训练阶段使用一般的训练方法;
然后,在模型参数固定时,在权重、激活、矩阵乘法、加法等节点之后人工地加入伪量化节点,再向模型喂入部分训练数据以获得伪量化节点需要记录的关于上一节点的最大值和最小值;随后进行模型参数固定,参数固定后,调用toco convert脚本,结合一般节点与其对应的伪量化节点的信息,得到量化模型。
2.根据权利要求1所述的基于DSP芯片与量化模型的三维物体识别方法,其特征在于,所述的DSP并行计算加速模块中DSP并行加速的方法包括:使用DSP指令时,使用直接内存访问DMA技术,将需要运算的数据直接放入DSP芯片内存中,运算结束后再次使用DMA将数据从DSP内存提取到设备内存中,其中,使用ARM框架的CPU与DSP芯片同时工作,即在DSP计算时,CPU同时在DMA,提取上一次DSP运算的结果,并准备将下一次DSP需要使用的数据写入DSP内存中,一旦DSP芯片计算完毕,则立刻执行DMA写入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911018559.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:手写板应用于教学的方法
- 下一篇:一种灯盏花药材的质量控制方法