AWS Trainium & Inferentia 文档

支持的架构

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

支持的架构

训练

在 AWS Trainium 实例(Trn1)上进行训练可实现采用分布式并行策略的大规模模型训练。

要求

  • 模型必须与 Neuron SDK 兼容。如果模型足够小,可以容纳在 16GB 内存内,那么任何能够成功编译的架构都支持训练。
  • 内存限制: 每个加速器有 16GB 内存用于存放模型权重、梯度、优化器状态和激活值。
  • 对于大型模型: 需要支持张量并行和/或流水线并行的自定义模型实现。

以下架构具有支持分布式训练的自定义模型实现

架构 任务 张量并行 流水线并行
Llama、Llama 2、Llama 3 文本生成
Qwen3 文本生成
Granite 文本生成

如果您需要为上面未列出的自定义模型添加支持,请查阅我们的训练贡献指南,了解如何实现支持分布式训练的自定义模型。您也可以在 Optimum Neuron GitHub 仓库中提出 issue 来请求支持。

推理

下表列出了 Optimum Neuron 在 Amazon EC2 Inf2 实例上支持的推理架构和任务。

如果列出了一个 LLM,例如一个具有 `text-generation` 任务的模型,这意味着它也支持 TGI

Transformers

架构 任务
ALBERT 特征提取、掩码填充、多项选择、问答、文本分类、词元分类
AST 特征提取、音频分类
BERT 特征提取、掩码填充、多项选择、问答、文本分类、词元分类
Beit 特征提取、图像分类
CamemBERT 特征提取、掩码填充、多项选择、问答、文本分类、词元分类
CLIP 特征提取、图像分类
ConvBERT 特征提取、掩码填充、多项选择、问答、文本分类、词元分类
ConvNext 特征提取、图像分类
ConvNextV2 特征提取、图像分类
CvT 特征提取、图像分类
DeBERTa (仅限 INF2) 特征提取、掩码填充、多项选择、问答、文本分类、词元分类
DeBERTa-v2 (仅限 INF2) 特征提取、掩码填充、多项选择、问答、文本分类、词元分类
Deit 特征提取、图像分类
DistilBERT 特征提取、掩码填充、多项选择、问答、文本分类、词元分类
DonutSwin 特征提取
Dpt 特征提取
ELECTRA 特征提取、掩码填充、多项选择、问答、文本分类、词元分类
ESM 特征提取、掩码填充、文本分类、词元分类
FlauBERT 特征提取、掩码填充、多项选择、问答、文本分类、词元分类
Granite 文本生成
Hubert 特征提取、自动语音识别、音频分类
Levit 特征提取、图像分类
Llama、Llama 2、Llama 3 文本生成
Mixtral 文本生成
MobileBERT 特征提取、掩码填充、多项选择、问答、文本分类、词元分类
MobileNetV2 特征提取、图像分类、语义分割
MobileViT 特征提取、图像分类、语义分割
ModernBERT 特征提取、掩码填充、文本分类、词元分类
MPNet 特征提取、掩码填充、多项选择、问答、文本分类、词元分类
Phi3 文本生成
Phi 特征提取、文本分类、词元分类
Qwen2、Qwen 3 文本生成
RoBERTa 特征提取、掩码填充、多项选择、问答、文本分类、词元分类
RoFormer 特征提取、掩码填充、多项选择、问答、文本分类、词元分类
Swin 特征提取、图像分类
T5 文本到文本生成
UniSpeech 特征提取、自动语音识别、音频分类
UniSpeech-SAT 特征提取、自动语音识别、音频分类、音频帧分类、音频 x-vector
ViT 特征提取、图像分类
Wav2Vec2 特征提取、自动语音识别、音频分类、音频帧分类、音频 x-vector
WavLM 特征提取、自动语音识别、音频分类、音频帧分类、音频 x-vector
Whisper 自动语音识别
XLM 特征提取、掩码填充、多项选择、问答、文本分类、词元分类
XLM-RoBERTa 特征提取、掩码填充、多项选择、问答、文本分类、词元分类
Yolos 特征提取、目标检测

Diffusers

架构 任务
Stable Diffusion 文本到图像、图像到图像、修复
Stable Diffusion XL Base 文本到图像、图像到图像、修复
Stable Diffusion XL Refiner 图像到图像、修复
SDXL Turbo 文本到图像、图像到图像、修复
LCM 文本到图像
PixArt-α 文本到图像
PixArt-Σ 文本到图像
Flux 文本到图像

Sentence Transformers

架构 任务
Transformer 特征提取、句子相似度
CLIP 特征提取、零样本图像分类

要了解如何导出用于推理的模型,您可以查看此指南