万圣节快乐,ResNet 请客!
社区文章 发布于 2024 年 10 月 31 日
一点万圣节小礼物🎃,我刚刚上传了一些小型的 ResNet,它们经过了前所未有的训练。应用户要求,我将最近的一组超参数(MobileNet-v4 Conv Small x ResNet Strikes Back / timm
,表格中的 ra4
)应用于 'Basic Block' ResNet-18 和 34,包括 V2(预激活)变体。
结果非常好!ResNet-18 的准确率达到 73-74%,ResNet-34 达到 77-78%,哇哦!
请参阅下表以了解更多背景信息。我列出了一些过去的“最佳”ResNet 结果:
- ResNet Strikes Back (
a1
,a1h
) - torchvision “自带电池” ResNets (
tv2
),它们是 RSB 的后续版本 - O.G. torchvision (
tv
) ResNets,范围在 18-50
实际上,我确实用类似的 ra4
超参数训练了一个 D
变体的 ResNet50,但它们的改进不如过去那么多,可能需要进一步的超参数调整和更多的增广。
模型 | 图像尺寸 | top1 | top5 | 参数数量 |
---|---|---|---|---|
resnet50d.ra4_e3600_r224_in1k | 224 | 80.958 | 95.372 | 25.58 |
resnet50.tv2_in1k | 224 | 80.856 | 95.43 | 25.56 |
resnet50d.a1_in1k | 224 | 80.686 | 94.712 | 25.58 |
resnet50.a1h_in1k | 224 | 80.662 | 95.306 | 25.56 |
resnet50.a1_in1k | 224 | 80.368 | 94.59 | 25.56 |
resnetv2_34d.ra4_e3600_r224_in1k | 224 | 78.268 | 93.956 | 21.82 |
resnetv2_34.ra4_e3600_r224_in1k | 224 | 77.636 | 93.528 | 21.8 |
resnet34.ra4_e3600_r224_in1k | 224 | 77.448 | 93.502 | 21.8 |
resnet34.a1_in1k | 224 | 76.428 | 92.88 | 21.8 |
resnet50.tv_in1k | 224 | 76.128 | 92.858 | 25.56 |
resnetv2_18d.ra4_e3600_r224_in1k | 224 | 74.412 | 91.928 | 11.71 |
resnet18d.ra4_e3600_r224_in1k | 224 | 74.324 | 91.832 | 11.71 |
resnetv2_18.ra4_e3600_r224_in1k | 224 | 73.578 | 91.352 | 11.69 |
resnet34.tv_in1k | 224 | 73.316 | 91.422 | 21.8 |
resnet18.a1_in1k | 224 | 71.49 | 90.076 | 11.69 |
resnet18.tv_in1k | 224 | 69.758 | 89.074 | 11.69 |
所有新权重在推理时都能很好地扩展到更高分辨率。这里有一些值得注意的地方。tv2
和 a1h
ResNet50 是在 176x176 分辨率下训练的,通过在 224x224 下评估,它们试图达到训练-测试分辨率差异的“峰值”(https://arxiv.org/abs/1906.06423)。当我研究 RSB 方法时,我不想为了在 224x224 评估时获得峰值而牺牲高分辨率扩展,只有在较低分辨率下训练的低成本 a3
才这样。你可以在这个 288x288 表格中看到,a1
RSB 还有更多的潜力,tv2
已经处于下降趋势,而 a1h
刚刚越过峰值。这些新的 ra4
是分辨率缩放的佼佼者,还有一些提升空间。
模型 | 图像尺寸 | top1 | top5 | 参数数量 |
---|---|---|---|---|
resnet50d.ra4_e3600_r224_in1k | 288 | 81.812 | 95.91 | 25.58 |
resnet50d.a1_in1k | 288 | 81.45 | 95.216 | 25.58 |
resnet50.a1_in1k | 288 | 81.232 | 95.108 | 25.56 |
resnet50.a1h_in1k | 288 | 80.914 | 95.516 | 25.56 |
resnet50.tv2_in1k | 288 | 80.87 | 95.646 | 25.56 |
resnetv2_34d.ra4_e3600_r224_in1k | 288 | 79.59 | 94.77 | 21.82 |
resnetv2_34.ra4_e3600_r224_in1k | 288 | 79.072 | 94.566 | 21.8 |
resnet34.ra4_e3600_r224_in1k | 288 | 78.952 | 94.45 | 21.8 |
resnet34.a1_in1k | 288 | 77.91 | 93.768 | 21.8 |
resnet50.tv_in1k | 288 | 77.252 | 93.606 | 25.56 |
resnetv2_18d.ra4_e3600_r224_in1k | 288 | 76.044 | 93.02 | 11.71 |
resnet18d.ra4_e3600_r224_in1k | 288 | 76.024 | 92.78 | 11.71 |
resnetv2_18.ra4_e3600_r224_in1k | 288 | 75.34 | 92.678 | 11.69 |
resnet34.tv_in1k | 288 | 74.8 | 92.356 | 21.8 |
resnet18.a1_in1k | 288 | 73.152 | 91.036 | 11.69 |
resnet18.tv_in1k | 288 | 71.274 | 90.244 | 11.69 |