[发明专利]一种针对边缘图像的语义分割优化方法及装置在审

专利信息
申请号: 201910059828.7 申请日: 2019-01-22
公开(公告)号: CN109919159A 公开(公告)日: 2019-06-21
发明(设计)人: 赵伟;傅一;王立豪;秦红波;王中正;王海 申请(专利权)人: 西安电子科技大学
主分类号: G06K9/34 分类号: G06K9/34
代理公司: 西安嘉思特知识产权代理事务所(普通合伙) 61230 代理人: 张捷
地址: 710071*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语义分割 像素分割 分割模型 图像边缘信息 随机场模型 边缘图像 连接条件 图像数据 图像语义 优化结果 优化 高级语义信息 获取图像 结果优化 局部边缘 算法获取 提取图像 图像边缘 优化算法 兼容性 鲁棒性 有效地 准确率 算法 验证 灵活 保留
【说明书】:

发明涉及一种针对边缘图像的语义分割优化方法,包括:选取图像数据;利用所述图像数据训练并验证图像语义分割模型和全连接条件随机场模型;利用训练后的所述图像语义分割模型获取图像的语义分割结果;利用超像素分割算法获取图像边缘信息的超像素分割结果;利用所述超像素分割结果优化所述语义分割结果,形成第一优化结果;利用训练后的所述全连接条件随机场模型优化所述第一优化结果。本发明提出的方法,能够有效地提取图像中的高级语义信息,通过超像素分割算法保留图像边缘信息,通过局部边缘优化算法提升了现有分割模型对图像边缘的语义分割准确率,实现灵活,兼容性强,具有较强的鲁棒性。

技术领域

本发明属于图像处理技术领域,具体涉及一种针对边缘图像的语义分割优化方法及装置。

背景技术

随着计算机科学体系的不断完善,以及多媒体和互联网技术的不断发展,作为计算机学科中的重要分支,以数字图像处理为代表的计算机视觉也在逐渐融入现代社会的各个角落。图像语义分割是计算机视觉中重要的基本问题之一,它的目标是对图像的每个像素点进行分类,将图像划分为若干个区域,区域之间各自独立没有重叠并且都具有各自的视觉意义,并给予它们不同的视觉标签,以利于后续的图像分析和视觉理解。从宏观角度上来说,图像的语义分割可以看作是场景理解任务的前期处理过程,而场景理解一直是计算机视觉领域的核心问题,随着人们对从图像视频等多媒体介质中获取语义信息的需求越来越多,图像语义分割变得愈发重要。从微观层面上讲,语义分割的目标是实现像素级分类,方法是对每个像素点单独进行分类,得到的结果则是整幅图像的语义标签。从实际应用的方面来说,图像语义分割实现的是目标的分割以及目标的识别两方面任务。

从上世纪中后期开始,研究者们就已经在致力于图像语义分割的研究,经过半个多世纪的积淀,学者们针对不同场景,提出了众多不同的语义分割算法。阈值分割法是图像分割领域最基础的方法之一,原理是根据图像中像素的颜色或灰度值的不同,对图像进行分割。但该方法对语义的识别效果一般,缺点也非常明显,当图像中像素的灰度值较接近或颜色差别不大时,出错概率较高,而且由于在实际情况下阈值的设置会受到噪声和光照的影响,想要得到合适的阈值是非常困难的,导致算法的适用范围较窄。基于边缘检测的方法是另一类传统分割方法,其基本思想是利用区域之间的特征不一致性,检测图像中存在的边缘点,然后按照既定的策略将所有的点连接成线,直到构成闭合区域。当图像边缘灰度值变化非常明显,同时图像几乎没有噪声存在时,获得的效果比较好,但当边缘较为复杂时分割效果不甚理想。因此这类分割算法适合分割边缘的灰度值过渡比较明显,整体图像噪声较小的图像。交互式图像分割,是一种基于图划分(Graph partioning)思想的分割方法。算法需要人为提供线索以区分不同的类别,常见的有二分类算法,典型的交互方式如人为框出前景目标或者在前景背景的边界处画线,之后算法会将人为添加的信息作为约束,自动产生分割结果。但交互式的分割方法需要人为介入,可想而知,这样的方式只适合处理少量图片,若有大量复杂场景下的图像,频繁人为标记是既费时又费力的。聚类的分割方法,通过比较图像中像素的灰度值,将其中差异较小的像素点分为同一类,这种将像素聚合再分类的方法称为聚类分割方法。虽然不必提供先验知识,不需要特征提取和识别,降低了语义分割的难度,但是,由于聚类算法极度依赖初始种子点的选取,不同的初始化结果会造成分割结果的巨大差异,同时较容易误判色差相近但属于不同类别的物体,整体而言其语义分割的准确率不高。

其后,概率图模型(Probabilistic Graphical Models,PGM)逐渐进入研究者们的视野,主要包括生成模型(Generative Models)和判别模型(Discrimitive Models)。条件随机场模型(Condition Random Fields,CRFs)作为判别模型的代表,是另一种不同于生成模型的典型概率图模型,CRF模型可以表示观测变量之间的关系,包括颜色和位置关系等。这一模型无疑是成功的,它已然成为目前应用最广泛的图像语义分割模型之一。后来的研究者们在此基础上也提出了很多改进模型,比如全连接条件随机场模型,它能够在进行语义分割的同时,考虑图像底层的细节信息比如纹理、全局上下文以及平滑先验,显著提升了语义分割的效果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910059828.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top