万圣节快乐,ResNet 请客!

社区文章 发布于 2024 年 10 月 31 日

一点万圣节小礼物🎃,我刚刚上传了一些小型的 ResNet,它们经过了前所未有的训练。应用户要求,我将最近的一组超参数(MobileNet-v4 Conv Small x ResNet Strikes Back / timm,表格中的 ra4)应用于 'Basic Block' ResNet-18 和 34,包括 V2(预激活)变体。

结果非常好!ResNet-18 的准确率达到 73-74%,ResNet-34 达到 77-78%,哇哦!

请参阅下表以了解更多背景信息。我列出了一些过去的“最佳”ResNet 结果:

  • ResNet Strikes Back (a1, a1h)
  • torchvision “自带电池” ResNets (tv2),它们是 RSB 的后续版本
  • O.G. torchvision (tv) ResNets,范围在 18-50

实际上,我确实用类似的 ra4 超参数训练了一个 D 变体的 ResNet50,但它们的改进不如过去那么多,可能需要进一步的超参数调整和更多的增广。

模型 图像尺寸 top1 top5 参数数量
resnet50d.ra4_e3600_r224_in1k 224 80.958 95.372 25.58
resnet50.tv2_in1k 224 80.856 95.43 25.56
resnet50d.a1_in1k 224 80.686 94.712 25.58
resnet50.a1h_in1k 224 80.662 95.306 25.56
resnet50.a1_in1k 224 80.368 94.59 25.56
resnetv2_34d.ra4_e3600_r224_in1k 224 78.268 93.956 21.82
resnetv2_34.ra4_e3600_r224_in1k 224 77.636 93.528 21.8
resnet34.ra4_e3600_r224_in1k 224 77.448 93.502 21.8
resnet34.a1_in1k 224 76.428 92.88 21.8
resnet50.tv_in1k 224 76.128 92.858 25.56
resnetv2_18d.ra4_e3600_r224_in1k 224 74.412 91.928 11.71
resnet18d.ra4_e3600_r224_in1k 224 74.324 91.832 11.71
resnetv2_18.ra4_e3600_r224_in1k 224 73.578 91.352 11.69
resnet34.tv_in1k 224 73.316 91.422 21.8
resnet18.a1_in1k 224 71.49 90.076 11.69
resnet18.tv_in1k 224 69.758 89.074 11.69

所有新权重在推理时都能很好地扩展到更高分辨率。这里有一些值得注意的地方。tv2a1h ResNet50 是在 176x176 分辨率下训练的,通过在 224x224 下评估,它们试图达到训练-测试分辨率差异的“峰值”(https://arxiv.org/abs/1906.06423)。当我研究 RSB 方法时,我不想为了在 224x224 评估时获得峰值而牺牲高分辨率扩展,只有在较低分辨率下训练的低成本 a3 才这样。你可以在这个 288x288 表格中看到,a1 RSB 还有更多的潜力,tv2 已经处于下降趋势,而 a1h 刚刚越过峰值。这些新的 ra4 是分辨率缩放的佼佼者,还有一些提升空间。

模型 图像尺寸 top1 top5 参数数量
resnet50d.ra4_e3600_r224_in1k 288 81.812 95.91 25.58
resnet50d.a1_in1k 288 81.45 95.216 25.58
resnet50.a1_in1k 288 81.232 95.108 25.56
resnet50.a1h_in1k 288 80.914 95.516 25.56
resnet50.tv2_in1k 288 80.87 95.646 25.56
resnetv2_34d.ra4_e3600_r224_in1k 288 79.59 94.77 21.82
resnetv2_34.ra4_e3600_r224_in1k 288 79.072 94.566 21.8
resnet34.ra4_e3600_r224_in1k 288 78.952 94.45 21.8
resnet34.a1_in1k 288 77.91 93.768 21.8
resnet50.tv_in1k 288 77.252 93.606 25.56
resnetv2_18d.ra4_e3600_r224_in1k 288 76.044 93.02 11.71
resnet18d.ra4_e3600_r224_in1k 288 76.024 92.78 11.71
resnetv2_18.ra4_e3600_r224_in1k 288 75.34 92.678 11.69
resnet34.tv_in1k 288 74.8 92.356 21.8
resnet18.a1_in1k 288 73.152 91.036 11.69
resnet18.tv_in1k 288 71.274 90.244 11.69

社区

我发现这篇文章很有帮助

注册登录 以评论