AWS Trainium & Inferentia 文档
支持的架构
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
支持的架构
训练
在 AWS Trainium 实例(Trn1)上进行训练可实现采用分布式并行策略的大规模模型训练。
要求
- 模型必须与 Neuron SDK 兼容。如果模型足够小,可以容纳在 16GB 内存内,那么任何能够成功编译的架构都支持训练。
- 内存限制: 每个加速器有 16GB 内存用于存放模型权重、梯度、优化器状态和激活值。
- 对于大型模型: 需要支持张量并行和/或流水线并行的自定义模型实现。
以下架构具有支持分布式训练的自定义模型实现
| 架构 | 任务 | 张量并行 | 流水线并行 |
|---|---|---|---|
| Llama、Llama 2、Llama 3 | 文本生成 | ✓ | ✓ |
| Qwen3 | 文本生成 | ✓ | ✓ |
| Granite | 文本生成 | ✓ | ✗ |
如果您需要为上面未列出的自定义模型添加支持,请查阅我们的训练贡献指南,了解如何实现支持分布式训练的自定义模型。您也可以在 Optimum Neuron GitHub 仓库中提出 issue 来请求支持。
推理
下表列出了 Optimum Neuron 在 Amazon EC2 Inf2 实例上支持的推理架构和任务。
如果列出了一个 LLM,例如一个具有 `text-generation` 任务的模型,这意味着它也支持 TGI。
Transformers
| 架构 | 任务 |
|---|---|
| ALBERT | 特征提取、掩码填充、多项选择、问答、文本分类、词元分类 |
| AST | 特征提取、音频分类 |
| BERT | 特征提取、掩码填充、多项选择、问答、文本分类、词元分类 |
| Beit | 特征提取、图像分类 |
| CamemBERT | 特征提取、掩码填充、多项选择、问答、文本分类、词元分类 |
| CLIP | 特征提取、图像分类 |
| ConvBERT | 特征提取、掩码填充、多项选择、问答、文本分类、词元分类 |
| ConvNext | 特征提取、图像分类 |
| ConvNextV2 | 特征提取、图像分类 |
| CvT | 特征提取、图像分类 |
| DeBERTa (仅限 INF2) | 特征提取、掩码填充、多项选择、问答、文本分类、词元分类 |
| DeBERTa-v2 (仅限 INF2) | 特征提取、掩码填充、多项选择、问答、文本分类、词元分类 |
| Deit | 特征提取、图像分类 |
| DistilBERT | 特征提取、掩码填充、多项选择、问答、文本分类、词元分类 |
| DonutSwin | 特征提取 |
| Dpt | 特征提取 |
| ELECTRA | 特征提取、掩码填充、多项选择、问答、文本分类、词元分类 |
| ESM | 特征提取、掩码填充、文本分类、词元分类 |
| FlauBERT | 特征提取、掩码填充、多项选择、问答、文本分类、词元分类 |
| Granite | 文本生成 |
| Hubert | 特征提取、自动语音识别、音频分类 |
| Levit | 特征提取、图像分类 |
| Llama、Llama 2、Llama 3 | 文本生成 |
| Mixtral | 文本生成 |
| MobileBERT | 特征提取、掩码填充、多项选择、问答、文本分类、词元分类 |
| MobileNetV2 | 特征提取、图像分类、语义分割 |
| MobileViT | 特征提取、图像分类、语义分割 |
| ModernBERT | 特征提取、掩码填充、文本分类、词元分类 |
| MPNet | 特征提取、掩码填充、多项选择、问答、文本分类、词元分类 |
| Phi3 | 文本生成 |
| Phi | 特征提取、文本分类、词元分类 |
| Qwen2、Qwen 3 | 文本生成 |
| RoBERTa | 特征提取、掩码填充、多项选择、问答、文本分类、词元分类 |
| RoFormer | 特征提取、掩码填充、多项选择、问答、文本分类、词元分类 |
| Swin | 特征提取、图像分类 |
| T5 | 文本到文本生成 |
| UniSpeech | 特征提取、自动语音识别、音频分类 |
| UniSpeech-SAT | 特征提取、自动语音识别、音频分类、音频帧分类、音频 x-vector |
| ViT | 特征提取、图像分类 |
| Wav2Vec2 | 特征提取、自动语音识别、音频分类、音频帧分类、音频 x-vector |
| WavLM | 特征提取、自动语音识别、音频分类、音频帧分类、音频 x-vector |
| Whisper | 自动语音识别 |
| XLM | 特征提取、掩码填充、多项选择、问答、文本分类、词元分类 |
| XLM-RoBERTa | 特征提取、掩码填充、多项选择、问答、文本分类、词元分类 |
| Yolos | 特征提取、目标检测 |
Diffusers
| 架构 | 任务 |
|---|---|
| Stable Diffusion | 文本到图像、图像到图像、修复 |
| Stable Diffusion XL Base | 文本到图像、图像到图像、修复 |
| Stable Diffusion XL Refiner | 图像到图像、修复 |
| SDXL Turbo | 文本到图像、图像到图像、修复 |
| LCM | 文本到图像 |
| PixArt-α | 文本到图像 |
| PixArt-Σ | 文本到图像 |
| Flux | 文本到图像 |
Sentence Transformers
| 架构 | 任务 |
|---|---|
| Transformer | 特征提取、句子相似度 |
| CLIP | 特征提取、零样本图像分类 |
要了解如何导出用于推理的模型,您可以查看此指南。