[发明专利]语义分割及网络训练方法和装置、设备、介质有效
申请号: | 201810055743.7 | 申请日: | 2018-01-19 |
公开(公告)号: | CN108280451B | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 石建萍 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62;G06K9/00 |
代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 毛丽琴 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语义 分割 网络 训练 方法 装置 设备 介质 | ||
本公开实施例公开了一种语义分割及网络训练方法和装置、设备、介质、程序,其中方法包括:对图像进行处理,获得所述图像对应的至少一个第一图像特征,和全局语义信息;基于所述全局语义信息和所述第一图像特征,得到第二图像特征;基于所述第二图像特征,获得所述图像的语义分割结果。本公开上述实施例,获得的图像语义分割结果,能够基于全局语义信息得到图像的语义分割结果,从而有利于提高语义分割性能。
技术领域
本公开涉及计算机视觉技术,尤其是一种语义分割及网络训练方法和装置、设备、介质。
背景技术
场景分析(Scene parsing)是基于语义分割,对描述场景的图像中的每一个像素赋予一个类别,并对不同的类别标注不同的颜色。场景分析是目标识别、图像检索、视频标注等的基础,在复杂场景中如果能够更好的利用场景分析对于场景理解的像素级理解非常关键,近年来已成为计算机视觉领域的研究热点。
发明内容
本公开实施例提供的一种语义分割技术。
根据本公开实施例的一个方面,提供的一种语义分割方法,包括:
对图像进行处理,得到所述图像的第一图像特征和所述图像的全局语义信息;
基于所述全局语义信息和所述第一图像特征,得到第二图像特征;
基于所述第二图像特征,获得所述图像的语义分割结果。
在基于本发明上述方法的另一个实施例中,所述全局语义信息包括与至少一个语义类别对应的至少一个缩放因子向量。
在基于本发明上述方法的另一个实施例中,所述基于所述全局语义信息和所述第一图像特征,得到第二图像特征,包括:
对所述全局语义信息和所述第一图像特征进行卷积处理,得到第二图像特征。
在基于本发明上述方法的另一个实施例中,所述对图像进行处理,得到所述图像的第一图像特征,包括:
对所述图像进行卷积处理,得到所述图像的第一图像特征。
在基于本发明上述方法的另一个实施例中,所述对图像进行处理,得到所述图像的全局语义信息,包括:
基于所述第一图像特征,得到所述全局语义信息。
在基于本发明上述方法的另一个实施例中,所述基于所述第一图像特征,得到所述全局语义信息,包括:
对所述第一图像特征进行编码处理,得到所述第一图像特征的编码结果;
基于所述第一图像特征的编码结果,得到所述全局语义信息。
在基于本发明上述方法的另一个实施例中,所述对所述第一图像特征进行编码处理,得到所述第一图像特征的编码结果,包括:
确定字典和所述字典对应的权重,所述字典包括至少一个字典基;
基于所述字典和所述字典对应的权重,对所述第一图像特征进行编码处理,得到所述第一图像特征的编码结果。
在基于本发明上述方法的另一个实施例中,基于所述第一图像特征的编码结果,得到所述全局语义信息,包括:
对所述第一图像特征的编码结果进行全连接处理,得到图像向量;
利用激活函数对图像向量进行处理,得到所述全局语义信息。
在基于本发明上述方法的另一个实施例中,所述第一图像特征包括至少一个特征图;
基于所述字典和所述字典对应的权重,对所述第一图像特征进行编码处理,得到所述第一图像特征的编码结果,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810055743.7/2.html,转载请声明来源钻瓜专利网。