YOLOv4(二):骨干网络的改进

CSPDarknet53

在Darknet53的基础上参考CSPNet加入了CSP(Cross Stage Paritial)结构。整个backbone划分为5个模块,每个模块下采样2倍。

如下图所示,CSP结构仅仅是将特征的一部分直接concat到block的末尾,这个操作使得该block中的每个dense layer的梯度不再直接参与更浅层的梯度计算,而是新计算出一个值(于是可以在反向传播到浅层时,清除深层的dense layer梯度信息),大量减少了内存的消耗和计算瓶颈。

image-20201219060045088.png

Mish激活函数

image.png

可以看出Mish比ReLU更加平滑,在每个点上都是可微的,优化效果更好;同时允许了较小的负梯度流入,更好地保证信息的流动。在YOLOv4中仅backbone使用了Mish,其它地方都用的Leaky ReLU。

Dropblock

Dropblock与Dropout类似。Dropout会随机丢弃网络中的一些信息,但卷积层对随机丢弃的信息并不敏感,即使随机丢弃一些像素,卷积也能从相邻的像素学到相同的信息。

于是Dropblock对整个局部区域进行丢弃,相当于对特征图进行CutOut操作。

image.png

-------------本文结束感谢您的阅读-------------