[发明专利]基于近红外摄像与深度学习的人手腕脉口位置精准定位方法在审
| 申请号: | 202111493641.1 | 申请日: | 2021-12-08 |
| 公开(公告)号: | CN114298978A | 公开(公告)日: | 2022-04-08 |
| 发明(设计)人: | 路红;罗静静;杨博弘;孟凯;聂鑫垚;黄冠豪;祝兴 | 申请(专利权)人: | 复旦大学 |
| 主分类号: | G06T7/00 | 分类号: | G06T7/00;G06N3/04;G06N3/08 |
| 代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
| 地址: | 200433 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 红外 摄像 深度 学习 人手 腕脉口 位置 精准 定位 方法 | ||
1.一种基于深度学习的人手腕脉口位置精准定位方法,其特征在于,首先通过近红外相机对多人进行手部图像采样,由专业医生进行脉口位置的标记,作为深度学习脉口定位网络模型的训练数据;然后构建深度学习网络模型,网络模型包括特征提取网络和回归网络,特征提取网络对训练集进行腕部轮廓纹理颜色等特征提取,将提取到的腕部特征通过回归网络进行脉口位置预测,得到泛化能力较强的深度学习脉口定位网络模型;最后将拍摄到的手部图像作为预先训练好的深度学习脉口定位网络模型的输入,预测得到手腕脉口在图像上的位置。
2.根据权利要求1所述的基于深度学习的人手腕脉口位置精准定位方法,其特征在于,具体步骤如下:
(1)获取深度学习的训练数据;
(2)构建深度学习定位网络模型;对采集的腕部图像进行划分;训练网络模型;
该网络模型结构由特征提取网络和回归网络组成;其中,所述特征提取网络的基本卷积块有两种,第一种卷积块包括卷积层、批归一化层、激活层、最大池化层和辍学层;第二种卷积块只包括卷积层、批归一化层、激活层和辍学层,没有最大池化层;所述卷积层在不同的卷积块中是不相同的,它们具有不同的卷积核和步长;其中,卷积层中的卷积核能对图片上每一小块像素区域进行处理,提取图像纹理信息;通过多层卷积层提取图像中的边缘信息,并总结出更高层的结构信息,用于识别桡骨所在位置的轮廓及腕部轮廓等特征,辅助脉口位置定位;批归一化层用于加快模型的收敛速度,使得训练深层网络模型更加容易和稳定;激活层用于增加网络的非线性表达能力;最大池化层用于特征降维、压缩数据和参数的数量、减小过拟合,同时提高模型的容错性;辍学层用于消除减弱神经元节点间的联合适应性,增强泛化能力;所述回归网络由一个全连接层组成,全连接层用于整合之前的卷积层和池化层提取的局部特征进行脉口位置定位;
(3)利用经过训练的网络模型,对采集的手部图像预测脉口位置。
3.根据权利要求2所述的基于深度学习的人手腕脉口位置精准定位方法,其特征在于,步骤(1)所述获取深度学习的训练数据,具体过程如下:
(11)通过红外相机对多个人进行手部图像采样;根据深度学习脉口定位网络模型对输入图像的形状要求,对采集的红外图像进行裁剪和放缩;每个人采样的图像数量不低于20张;采集时,固定拍摄高度为20cm,手腕变换为各种不同的位姿,并保确整个手及手腕包含在图像内;
(12)由专业医生对脉口位置进行有效标记。
4.根据权利要求3所述的基于深度学习的人手腕脉口位置精准定位方法,其特征在于,步骤(2)中所述对采集的腕部图像进行划分,是划分为训练集、测试集、验证集;
对于步骤(1)中采集数据集即红外图像进行划分,其中,20%作为测试集;然后对80% 那部分的数据进行增强处理:首先将这些红外图像进行右移50 pixel,生成相对原图右移50pixel的新的图片,将产生的新图片再进行下移得到相对于新图片下移50pixel的图片,将上述3个数据集联合起来,共得到3倍原数据集的图片;接着将这些数据以8:2的比例分割为训练集、验证集;训练集用于拟合模型,通过设置深度学习脉口定位网络模型的超参数,训练深度学习脉口定位网络模型;验证集作用是当通过训练集训练出多个模型后,为了能找出效果最佳的模型,使用各个模型对验证集数据进行预测,并记录模型准确率,选出效果最佳的模型所对应的参数;测试集作用是当训练集和验证集得出最优模型后,使用测试集进行模型预测,来衡量该最优模型的性能和分类能力。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111493641.1/1.html,转载请声明来源钻瓜专利网。





