[发明专利]基于Transformer的非接触式呼吸率测量方法有效
申请号: | 202210232829.9 | 申请日: | 2022-03-10 |
公开(公告)号: | CN114343612B | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 王金桥;葛国敬;朱贵波 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | A61B5/08 | 分类号: | A61B5/08;A61B5/00;G06V10/25;G06N3/08;G06V20/40;G06V40/16;G06V10/82 |
代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩;尹文会 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 transformer 接触 呼吸 测量方法 | ||
1.一种基于Transformer的非接触式呼吸率测量方法,其特征在于,该方法包括:
步骤S100,获取设定时间段内包含人脸信息的待测视频帧序列;
步骤S200,基于所述待测视频帧序列,通过人脸检测模型和人脸关键点模型获取人脸感兴趣区域图像序列;
步骤S300,基于所述人脸感兴趣区域图像序列,通过训练好的端到端Transformer模型获取设定时间段内的呼吸率序列;
其中,所述端到端Transformer模型基于顺次连接的预处理模块、一阶特征提取模块、二阶特征提取模块、三阶特征提取模块和四阶特征提取模块和全连接层构建;
所述预处理模块,用于对输入的待测视频帧序列进行切块操作;
所述一阶特征提取模块基于线性映射模块、Swin Transformer Block模块构建;所述线性映射模块,用于将切块后的待测视频帧序列映射至设定维度;
所述Swin Transformer Block模块包括第一子模块、第二子模块;
所述第一子模块基于顺次连接的归一化层、第一注意力层、归一化层、多层感知机构建;所述第二子模块基于顺次连接的归一化层、第二注意力层、归一化层、多层感知机构建;所述第一注意力层为窗口多头注意力层;所述第二注意力层为移位窗口多头注意力层;
所述二阶特征提取模块、所述三阶特征提取模块和所述四阶特征提取模块均基于块融合模块、Swin Transformer Block模块构建;
所述块融合模块,用于依次对输入的特征进行下采样,串联、归一化、线性映射处理。
2.根据权利要求1所述的基于Transformer的非接触式呼吸率测量方法,其特征在于,步骤S200与步骤S300之间还包括样本扩增步骤:
基于所述人脸感兴趣区域图像序列,通过裁剪和仿射变换的方法获取不同尺度的人脸图片集;
基于所述不同尺度人脸图片集,通过部分区域擦除和左右翻转的方法进行样本扩增获得扩增人脸图片集,并将扩增人脸图片集按时间排序生成扩增的人脸感兴趣区域图像序列。
3.根据权利要求1所述的基于Transformer的非接触式呼吸率测量方法,其特征在于,所述窗口多头注意力层的每个窗口内的query与窗口内的key值进行注意力计算,不与特征图内全部的key值进行计算。
4.根据权利要求1所述的基于Transformer的非接触式呼吸率测量方法,其特征在于,所述移位窗口多头注意力层中的多头注意力在进行注意力机制的计算时,先对原始的特征块依次进行切块、移位、拼接处理,再进行特征块与特征块之间注意力机制的计算。
5.根据权利要求1所述的基于Transformer的非接触式呼吸率测量方法,其特征在于,所述端到端Transformer模型,其训练方法为:
步骤A100,获取训练视频帧序列;基于所述训练视频帧序列,通过人脸检测模型和人脸关键点模型获取人脸感兴趣区域图像序列;将训练视频帧序列所对应的人脸感兴趣区域图像序列及其标准呼吸率序列作为训练样本,构建训练样本集;
步骤A200,将训练样本集中的人脸感兴趣区域图像序列进行预处理;所述预处理为基于所述人脸感兴趣区域图像序列,按时间顺序均匀采样F张图像作为待处理采样帧;
步骤A300,将所述待处理采样帧输入所述端到端Transformer模型,得到预测的设定时间段内的呼吸率序列;
步骤A400,基于端到端Transformer模型预测的设定时间段内的呼吸率序列、标准呼吸率序列,计算损失值,并调整所述端到端Transformer模型参数;
步骤A500,循环执行步骤A200-步骤A400,直至得到训练好的端到端Transformer模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210232829.9/1.html,转载请声明来源钻瓜专利网。
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法