[发明专利]基于位置注意力和辅助网络的3D点云语义分割方法有效
| 申请号: | 201910604264.0 | 申请日: | 2019-07-05 |
| 公开(公告)号: | CN110322453B | 公开(公告)日: | 2023-04-18 |
| 发明(设计)人: | 焦李成;冯志玺;张格格;杨淑媛;程曦娜;马清华;张杰;郭雨薇;丁静怡;唐旭 | 申请(专利权)人: | 西安电子科技大学 |
| 主分类号: | G06T7/11 | 分类号: | G06T7/11;G06N3/0464;G06N3/08 |
| 代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华 |
| 地址: | 710071 陕*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 位置 注意力 辅助 网络 语义 分割 方法 | ||
1.一种基于位置注意力和辅助网络的3D点云语义分割方法,其特征在于,包括如下:
(1)从ScanNet官网下载3D点云数据的训练文件和测试文件,并对其进行类别统计和切块处理,获取训练集T和测试集V;
(2)构建3D点云语义分割网络,其包括依次级联的特征下采样网络,位置注意力模块,特征上采样网络和辅助网络;
所述的位置注意力模块,包括3个独立的1D卷积层Q、U、V,用于提取该模块的输入数据F的特征,并计算各个质心所代表的特征之间的注意力影响值tij和注意力加强后的特征E:
E=[E1;E2;...;Ei;...;EN]
其中,Ui表示位置注意力模块的输入数据F经过1D卷积层U提取的第i个质心的特征,QjT表示位置注意力模块的输入数据F经过1D卷积层Q提取的第j个质心的特征的转置,N表示F的质心数量,Ei表示E中第i个质心的特征,计算公式为:
其中,Vj表示F经过1D卷积层V提取的第j个质心的特征,表示经过位置注意力后的第i个质心的特征,α表示位置注意力特征的权重,Fi表示输入的第i个质心的特征;
所述的辅助网络,包括依次级联的b个PointAux模块和用于分类的1D卷积层,每个PointAux模块包括1D卷积层和特征插值层,其中,b≥1;
(3)使用多分类的交叉熵损失函数,作为3D点云语义分割网络的损失函数;
(4)使用训练集T,对3D点云数据语义分割网络进行P轮有监督的训练,P≥500:
(4a)在每轮训练过程中,根据语义分割网络的损失函数,调整网络参数,得到网络模型;
(4b)每隔P1轮,使用测试集的样本对当前网络模型的分割精度进行评估,若当前网络模型的分割精度高于之前保存的网络模型,则进行保存,P1≥2;
(4c)P轮训练完成后,把分割精度最高的网络模型作为训练好的网络模型;
(5)将测试集V输入到训练好的网络模型中进行语义分割,得到每一个点的分割结果。
2.根据权利要求1所述的方法,其特征在于,(1)中对点云数据进行类别统计和切块处理,实现如下:
(1a)使用直方图统计训练文件中所有f0个场景的点云数据各个类别的数目,并计算各个类别的权重wk:
其中,Gk表示第k类点云数据的数目,M表示所有点云数据的数目,L表示分割类别数,f0≥1000,L≥2;
(1b)对训练文件中的每个场景,随机选取一个点作为中心点,坐标为(x,y,z),在其周围取(x-0.75,x+0.75),(y-0.75,y+0.75),(z-0.75,z+0.75)范围中的点,组成一个数据块,并将该数据块中的点数与采样点数N0进行比较,判断其是否合理:
若该数据块中的点数大于采样点数N0,则判为该数据块合理,并在该数据块中随机采样N0个点,组成一个样本数据,否则,抛弃该数据块,由此得到训练集T,其中,N0≥4096;
(1c)对于测试文件中所有f1个场景中的每一个场景,使用大小为1.5×1.5×3的立方体窗口进行滑窗切块,对每个数据块,随机采样N0个点,组成一个样本数据,得到测试集V,f1≥300。
3.根据权利要求1所述的方法,其特征在于,(2)中所述的特征下采样网络,包括n个级联的PointSA模块,每个PointSA模块包括依次级联的点云质心采样以及分组层、点云特征提取层,其中,n≥2。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910604264.0/1.html,转载请声明来源钻瓜专利网。





