[发明专利]一种基于位平面分离重组合数据增强方法有效
| 申请号: | 201910700184.5 | 申请日: | 2019-07-31 | 
| 公开(公告)号: | CN110503612B | 公开(公告)日: | 2022-01-14 | 
| 发明(设计)人: | 张伟;彭芝珏;朱志良;于海;赵玉丽 | 申请(专利权)人: | 东北大学 | 
| 主分类号: | G06T5/00 | 分类号: | G06T5/00;G06T3/60;G06T7/90;G06N3/08 | 
| 代理公司: | 大连理工大学专利中心 21200 | 代理人: | 陈玲玉;梅洪玉 | 
| 地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | 本发明提供一种基于位平面分离重组合数据增强方法,解决了传统计算机视觉领域中的数据增强中这些不能解决的场景。该方法利用位平面的比特级0‑1二进制图像进行位平面的分离和一定比例重组合,在重组合中打乱位平面的顺序,产生灰度通道或者RGB通道新的像素点,且通过一些特定的方式保持图像本有的基本视觉效果,来产生新的增强图像数据从而扩大图像数据集。本发明也同时兼容传统的图片翻转、旋转、缩放、裁剪、平移、放大等方式,大大增加了有效图像数据的数量,提高数据集的鲁棒性,产生的结果更具有普适性,很大程度上解决计算机视觉上数据严重缺少的问题。 | ||
| 搜索关键词: | 一种 基于 平面 分离 组合 数据 增强 方法 | ||
【主权项】:
                1.一种基于位平面分离重组合数据增强方法,其特征在于,包括以下步骤:/n(1)对一个RGB三通道彩色图像进行颜色通道的分离,得到R、G、B三个单通道图像;将每个二进制位按照公式bm-12m-1+bm-22m-2…+b020(m=8)分别展开,得到8个位平面;对这三幅图进行位平面的分离,将每幅图划分为8个比特平面,即8个二值图像矩阵;其中,b代表每一个位平面的二进制像素,2代表每一个进制,m代表8个位平面;/n(2)通过分析图像位平面图分析出每个位平面中占据源图像视觉效果的重要程度,按位数从小到大排成1到8位,第八位的位平面在二进制中是像素的27~28区域,当第八位取1的时候,最大的像素值取为11111111(255),最小的像素值取为10000000(128);当第八位取0的时候,最大的像素值取为01111111(127),最小的像素值取为00000000(0),第八位的像素的0/1的对应源图像十进制范围为(0~127)/(128~255),第七位的像素的0/1的对应源图像十进制范围为(0~191)/(64~255);第八位的混淆像素区域为0,而第七位的混淆像素区域为(64~191);则第六位得到混淆像素区域为(32~223);/n首先,要读取图像为矩阵格式,然后通过循环读取图像的不同位存储在新建的binary_matrix矩阵中;如此之后binary_matrix保存了八个通道的位平面0-1矩阵;将三个通道的图像的位平面分离出来,得到了24个位平面图像,然后有两种置换顺序的方式,第一种是采取默认的置乱顺序,即之前提到的最小混淆像素区域,采取三个最小的混淆像素区域进行置乱,即678位平面,组合为12345678、12345687、12345768、12345786、12345867、12345876六种重组合方式,第二种是通过观察图像本身的视觉结构,通过代码分析像素占比,抽取像素范围占比最大的进行图像重组合分析,保证重组合视觉效果能保持之前源图像结构;/n在图像位平面分离后重组合,得到新的RGB图像放入数据集中作为新的训练数据。/n
            
                    下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
                
                
            该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910700184.5/,转载请声明来源钻瓜专利网。





