0%

YOLOv4

发表于 2022-05-24 更新于 2022-08-27 分类于深度学习算法阅读次数： Valine：

本文字数： 722 阅读时长 ≈ 1 分钟

Bag of freebies(BOF)

Mosaic data augmentation

Mixup：让两张图片的像素值对应相加，生成一张新的图片；

Cutout：对一张图片的部分进行遮挡；

CutMix：把多张图片进行缩放，拼接到一张图片上；

数据增强

Random Erase：用随机值或训练集的平均像素替换图像的区域；

Hide and Seek：根据概率设置随机隐藏一些补丁；

Self-adversarial-training(SAT)

系数要足够小

DropBlock

之前是随机失活一个像素点，但是周围的像素点还存在，其实对整个图像的影响并不大；

现在随机吃掉一个区域，使网络的性能更好。

Label Smoothing

平滑标签，不让边界感那么强，可以提高图像的识别率；

这个0.1的系数是自己设置的；

IOU损失

GIOU损失

重点：是在不重叠的情况下，预测框向真实框前进，不重叠，不重叠！！！！

当重叠时，不能反应出来情况的好坏；

DIOU损失

CIOU损失

DIOU-NMS

SOFT-NMS

先不直接剔除，而是降低置信度，再给一次机会。

SPPNet

虽然输出的图像尺寸大小可能不一样，但是通过最大池化来满足最终输入特征图的大小是一样的。

CSPNet

把特征图平均分成两部分，一部分什么都不做，另外一部分经过卷积进行输出，虽然精度上可能有所降低，但是速度上会加快很多，但是结果表现精度可能并没有降低，还有一点点升高。

CBAM

Channel Attention Module:对不同特征图产生一个概率，这个概率值表示对不同特征图的关注度；

SAM：对于特征图的不同位置的注意力机制；

PAN

激活函数MISH

eliminate grid sensitivity

在σ(ty)前加上大于1的系数；

整体网络架构