[发明专利]一种基于全卷积台标分割网络的台标分割方法在审
申请号: | 201711156139.5 | 申请日: | 2017-11-20 |
公开(公告)号: | CN108009629A | 公开(公告)日: | 2018-05-08 |
发明(设计)人: | 张静;徐佳宇;苏育挺;刘安安 | 申请(专利权)人: | 天津大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06T7/194;G06K9/62;G06K9/46 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 杜文茹 |
地址: | 300192*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 台标 分割 网络 方法 | ||
一种基于全卷积台标分割网络的台标分割方法,构建一个多类型的细粒度台标数据集,共有8400张图像的台标图像集,覆盖42种类别;根据逐像素标注的台标区域提取方法,建立与台标图像集对应的二值标签图像集,并转化为L类型的单通道灰度图像集;建立端到端的编码器‑解码器结构的全卷积台标分割网络,在台标数据集上对全卷积台标分割网络进行训练,将台标图像集中任意尺寸的测试图像输入到训练好的全卷积台标分割网络中,产生与输入图像相同尺寸的像素级分割结果。本发明有助于深度卷积神经网络实现强大的性能,解决了细微目标分割中结果不够精细的问题,网络模型能勾画出细微目标,从而提高输出的空间精度,适合应用到细微目标分割方法中。
技术领域
本发明涉及一种台标分割方法。特别是涉及一种基于全卷积台标分割网络的台标分割方法。
背景技术
如今随着各种视频软件的出现,海量视频在网络平台上产生并实时传播,对这些视频进行分类、收录和分析等应用的需求度与日俱增。由于台标包含视频来源、取向和类别等重要信息,因此被视为视频的重要标识。通过分割台标以达到视频分类的算法应运而生,由此在图像分割技术要求方面带来了巨大的挑战。
特征提取是台标分割过程中的重要步骤,因此寻找更具描述能力的特征一直是科研人员追求的目标。目前台标特征提取方法包括基于人工特征提取的方法和基于深度卷积特征提取的方法。
传统台标分割方法基于人工特征的提取,包括形状、颜色、边缘、纹理、网格和主要成分分析等特征。形状特征要求从视频画面中将台标完整分割出来,对其进行描述。但由于台标域一般由复杂镂空结构组成,包含较多背景噪声,现有图像分割技术无法将二者完全分割。颜色特征具有较强的可分离性,但对于半透明型台标,由于视频画面良莠不齐或受背景颜色影响,台标颜色通常会发生变化,因此不稳定的颜色特征会为台标分割带来困难。网格和主要成分分析特征将区域内所有内容等同对待,但由于没有充分考虑台标可能存在镂空等结构特点,该特征受背景影响也较大。
由于传统的人工特征描述能力有限,无法达到预期的分割效果,而研究表明,深度卷积特征比人工特征拥有更强大的描述能力。同时随着深度学习在计算机视觉领域的快速发展,基于深度卷积特征提取的台标分割方法获得了更多的关注。深度卷积特征的加入,推动台标图像分割领域的研究和发展进入一个新的阶段。
发明内容
本发明所要解决的技术问题是,提供一种能够提高输出的空间精度基于全卷积台标分割网络的台标分割方法。
本发明所采用的技术方案是:一种基于全卷积台标分割网络的台标分割方法,包括如下步骤:
1)构建一个多类型的细粒度台标数据集,共有8400张图像的台标图像集,覆盖42种类别;
2)根据逐像素标注的台标区域提取方法,建立与台标图像集对应的二值标签图像集,并转化为L类型的单通道灰度图像集;
3)建立端到端的编码器-解码器结构的全卷积台标分割网络,在台标数据集上对全卷积台标分割网络进行训练,将台标图像集中任意尺寸的测试图像输入到训练好的全卷积台标分割网络中,产生与输入图像相同尺寸的像素级分割结果。
步骤2)所述的逐像素标注的台标区域提取方法,是对8400张图像的台标图像集中的每张图像逐一标注所有像素点,将显著性台标区域中的每个像素值标注为显著性台标区域所属的类别数,将背景区域中的每个像素值标注为0,生成与台标图像集对应的有效标注的二值标签图像集,对整个标签图像集进行灰度化处理,得到L类型的单通道灰度图像集。
步骤3)所述的建立端到端的编码器-解码器结构的全卷积台标分割网络,首先建立编码器结构,具体是删除现有的分类网络VGGNet中的全连接层,将剩余的部分构成编码器结构;然后建立解码器结构,所述解码器结构与编码器结构相同,且在全卷积台标分割网络中与编码器结构对称设置,最后在解码器结构的上采样过程中引入编码器结构中的最大池化索引,用于保证在特征提取过程中保留边界信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711156139.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种旋转式碾压机
- 下一篇:既有建筑空调用能模型构建方法及空调能耗预测方法