ResNeSt
一个 ResNeSt 是一个 ResNet 的变体,它堆叠了 分割注意力块。然后将基数组表示沿通道维度连接{\( V^{1},V^{2},\cdots{V}^{K} \)}. 就像在标准残差块中一样,最终输出其他分割注意力块是使用快捷连接生成的, 如果输入和输出特征图具有相同的形状。对于具有步长的块,相应的变换应用于快捷连接以对齐输出形状. 例如,可以是步长卷积或组合卷积与池化。
如何在图像上使用此模型?
要加载预训练模型
>>> import timm
>>> model = timm.create_model('resnest101e', pretrained=True)
>>> model.eval()
要加载和预处理图像
>>> import urllib
>>> from PIL import Image
>>> from timm.data import resolve_data_config
>>> from timm.data.transforms_factory import create_transform
>>> config = resolve_data_config({}, model=model)
>>> transform = create_transform(**config)
>>> url, filename = ("https://github.com/pytorch/hub/raw/master/images/dog.jpg", "dog.jpg")
>>> urllib.request.urlretrieve(url, filename)
>>> img = Image.open(filename).convert('RGB')
>>> tensor = transform(img).unsqueeze(0) # transform and add batch dimension
要获取模型预测
>>> import torch
>>> with torch.no_grad():
... out = model(tensor)
>>> probabilities = torch.nn.functional.softmax(out[0], dim=0)
>>> print(probabilities.shape)
>>> # prints: torch.Size([1000])
要获取前 5 个预测的类名
>>> # Get imagenet class mappings
>>> url, filename = ("https://raw.githubusercontent.com/pytorch/hub/master/imagenet_classes.txt", "imagenet_classes.txt")
>>> urllib.request.urlretrieve(url, filename)
>>> with open("imagenet_classes.txt", "r") as f:
... categories = [s.strip() for s in f.readlines()]
>>> # Print top categories per image
>>> top5_prob, top5_catid = torch.topk(probabilities, 5)
>>> for i in range(top5_prob.size(0)):
... print(categories[top5_catid[i]], top5_prob[i].item())
>>> # prints class names and probabilities like:
>>> # [('Samoyed', 0.6425196528434753), ('Pomeranian', 0.04062102362513542), ('keeshond', 0.03186424449086189), ('white wolf', 0.01739676296710968), ('Eskimo dog', 0.011717947199940681)]
将模型名称替换为要使用的变体,例如 resnest101e
。您可以在此页面顶部模型摘要中找到 ID。
要使用此模型提取图像特征,请按照 timm 特征提取示例 进行操作,只需更改要使用的模型名称。
如何微调此模型?
您可以通过更改分类器(最后一层)来微调任何预训练模型。
>>> model = timm.create_model('resnest101e', pretrained=True, num_classes=NUM_FINETUNE_CLASSES)
要在您自己的数据集上进行微调,您必须编写一个训练循环或修改 timm 的训练脚本 以使用您的数据集。
如何训练此模型?
您可以按照 timm 食谱脚本 从头开始训练一个新模型。
引用
@misc{zhang2020resnest,
title={ResNeSt: Split-Attention Networks},
author={Hang Zhang and Chongruo Wu and Zhongyue Zhang and Yi Zhu and Haibin Lin and Zhi Zhang and Yue Sun and Tong He and Jonas Mueller and R. Manmatha and Mu Li and Alexander Smola},
year={2020},
eprint={2004.08955},
archivePrefix={arXiv},
primaryClass={cs.CV}
}