[发明专利]视频中基于网络重参数技术的多目标快速分割方法在审
| 申请号: | 202210963473.6 | 申请日: | 2022-08-10 |
| 公开(公告)号: | CN115409983A | 公开(公告)日: | 2022-11-29 |
| 发明(设计)人: | 陈少辉;杜丰;丁述勇;徐晓刚 | 申请(专利权)人: | 浙江工业大学之江学院 |
| 主分类号: | G06V10/26 | 分类号: | G06V10/26;G06N3/04;G06N3/08;G06V10/75;G06V10/774;G06V10/82 |
| 代理公司: | 杭州鼎乎专利代理事务所(普通合伙) 33377 | 代理人: | 黄楠 |
| 地址: | 312030 浙江省*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 视频 基于 网络 参数 技术 多目标 快速 分割 方法 | ||
1.视频中基于网络重参数技术的多目标快速分割方法,其特征,包括以下步骤:
构造神经网络模型架构;
神经网络模型架构分为训练网络和预测网络,训练网络和预测网络均有数据增强、数据细化、数据归一化、下采样、上采样和ACS损失函数六个部分;
将训练时神经网络模型复杂架构的参数重定向到简单预测推理网络上,使网络在训练时获取的参数准确优势在快速推理时起作用,达到视频中多目标的快速准确分割与识别。
2.如权利要求1所述的视频中基于网络重参数技术的多目标快速分割方法,其特征在于,数据增强部分对网络框架前端放大、旋转、镜像、灰度转换后的图像数据进行准确读取。
3.如权利要求1所述的视频中基于网络重参数技术的多目标快速分割方法,其特征在于,在神经网络模型架构前端引入数据细化部分来修改和扩展神经网络模型架构以兼容彩色和灰度图像。
4.如权利要求1所述的视频中基于网络重参数技术的多目标快速分割方法,其特征在于,数据归一化部分对输入图像数据进行均方差归一化预处理,加速网络收敛。
5.如权利要求1所述的视频中基于网络重参数技术的多目标快速分割方法,其特征在于,下采样部分遵循卷积网络的代表性架构,训练网络的整个下采样部分涉及两次重复使用两次RepVGG Block卷积和三次重复使用四次RepVGG Block卷积,预测网络的整个下采样部分涉及两次重复使用两次3×3卷积和三次重复使用四次3×3卷积。
6.如权利要求1所述的视频中基于网络重参数技术的多目标快速分割方法,其特征在于,上采样部分除了Content-aware Upsampling技术外,此部分结构与FCN-8S相同,数据更详细准确,在金字塔的顶部,提取的特征由内容感知重组上采样的解码器处理。
7.如权利要求1所述的视频中基于网络重参数技术的多目标快速分割方法,其特征在于,ACS损失函数部分由基于区域、质心和形状监督的混合函数计算,计算网络在训练期间的误差损失,最终总的Loss是对三个因素的真实值和预测值误差值计算的加权和,具体的计算方法为:
LossACS=C1·Shape+C2·Centroid+C3·Region,
其中,C1、C2、C3分别代表权重,Shape表示形状误差,Centroid表示质心误差,Region表示区域误差。
8.如权利要求7所述的视频中基于网络重参数技术的多目标快速分割方法,其特征在于,从形状方面对网络性能进行监督,使用Hu矩标识二值化图像的形状,通过计算Hu矩的欧几里德距离来计算预测图像和GT图像中像素的强度及其位置,具体的计算方法为:
其中,GroundTruth图像和Predict预测图像分别表示为G和P,D(P,G)是预测图像和标注GT图像的Hu矩之间的欧几里得距离,Hi、j取决于像素的强度及其在图像中的位置,ε(ε0)是避免在计算中平方根为零的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学之江学院,未经浙江工业大学之江学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210963473.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种增强复合型鞘管
- 下一篇:一种钕铁硼磁体及其制备方法





