YOLOv4
Bag of freebies(BOF)
Mosaic data augmentation
Mixup:让两张图片的像素值对应相加,生成一张新的图片;
Cutout:对一张图片的部分进行遮挡;
CutMix:把多张图片进行缩放,拼接到一张图片上;
数据增强
Random Erase:用随机值或训练集的平均像素替换图像的区域;
Hide and Seek:根据概率设置随机隐藏一些补丁;
Self-adversarial-training(SAT)
系数要足够小
DropBlock
之前是随机失活一个像素点,但是周围的像素点还存在,其实对整个图像的影响并不大;
现在随机吃掉一个区域,使网络的性能更好。
Label Smoothing
平滑标签,不让边界感那么强,可以提高图像的识别率;
这个0.1的系数是自己设置的;
IOU损失
GIOU损失
重点:是在不重叠的情况下,预测框向真实框前进,不重叠,不重叠!!!!
当重叠时,不能反应出来情况的好坏;
DIOU损失
CIOU损失
DIOU-NMS
SOFT-NMS
先不直接剔除,而是降低置信度,再给一次机会。
SPPNet
虽然输出的图像尺寸大小可能不一样,但是通过最大池化来满足最终输入特征图的大小是一样的。
CSPNet
把特征图平均分成两部分,一部分什么都不做,另外一部分经过卷积进行输出,虽然精度上可能有所降低,但是速度上会加快很多,但是结果表现精度可能并没有降低,还有一点点升高。
CBAM
Channel Attention Module:对不同特征图产生一个概率,这个概率值表示对不同特征图的关注度;
SAM:对于特征图的不同位置的注意力机制;
PAN
激活函数MISH
eliminate grid sensitivity
在σ(ty)前加上大于1的系数;