论文名称:Exploring the Effects of Data Augmentation for Drivable Area Segmentation,是一篇Cityscapes数据集上构建freespace segmentation的技术报告。研究了语义分割模型的数据增强方法,提出了一个魔改 UNet + CBAM 模型,在 Cityscapes 验证,但没有说明是如何在 Cityscapes 构建 drivable area ground truth 的。
整理了可套用的各种数据增强方法,发现调整对比度(CLAHE和RandomGamma)非常好用:
Rotation Flip
Random Crop
Random Scale
CutMix
CLAHE 是对朴素的直方图均衡算法的优化。
- 直方图均衡算法(Histogram Equalization):将源直方图dx宽度所盛纳的p(x)dx个像素映射到目标直方图的dy宽度中,映射前后像素数量不变,密度发生变化。也就是说,x对应的y值是原图上0~x这些像素的概率之和。
- 自适应直方图均衡算法(Adaptive HE): 直方图均衡的基本单位不再是整个图像,而是对每个patch做直方图均衡。
- HE系列方法的问题是放大噪声: 如果一个区域的像素分布大体是均匀的,但是图像中带有一些噪声,则HE变换函数会把原图中很窄的x值分布映射到整个y值空间,这同时也就放大了原图中的噪声。
- 限制对比度(Contrast Limited)自适应直方图均衡 aka CLAHE:
Random Gamma 随机γ对图像做γ变换。γ变换将灰度过高或者灰度过低的图片进行修正,增强对比度。
Color Jitter
Blur
- GaussianBlur
- GlassBlur
- HueSaturation
- MotionBlur
Noise
- ISONoise
- OpticalDistortion
Posterize 海报化
PIL ImageOp 说明 当变量bits为2时,将每个颜色通道的像素值低6bit清0,保留剩下的2 bit位。即124=二进制1111100,其处置之后为,二进制1000000=32。
Weather simulations
- Random Fog
- Random Rain
- Random Snow
- Random Sun flare
文档信息
- 本文作者:Mengqi Cao
- 本文链接:https://rogercmq.github.io//2022/10/03/Exploring_the_Effects_of_Data_Augmentation_for_Drivable_Area_Segmentation/
- 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证)