当前位置 博文首页 > 影醉阏轩窗:Rethinking Training from Scratch for Object Dete
正常训练目标检测的流程分为以下几种:
两种方式各有千秋,前者可以很快收敛(在特定数据集收敛快),但是训练复杂(预训练实际长)。后者直接训练较为容易(尤其在修改模型结构时),但是训练周期较长(比tune阶段长很多)。这篇文章就是解决从头训练的时长问题,从而达到集成两者的优点(夸大其词的说法)。
论文比较简单,这里进行总结如下:
代码地址: 链接地址
论文地址: 链接地址
按照上述的总结,论文进行改进的训练如下:
使用BN层(当前网络基础结构)
Pretrained先用小尺度图像进行训练,\(batchsize\)设置较大
数据处理部分-->先将图像缩放到 \((H,W)\times(1.0,1.2)\) ,随机RandomCrop-->\((H,W)\),最后进行Padding到 \((h,W)\)
Finetune阶段按照正常训练即可