适用于 Intel Gaudi 的 Optimum
适用于 Intel Gaudi 的 Optimum 是 Transformers 和 Diffusers 库与 Intel® Gaudi® AI 加速器 (HPU) 之间的接口。它提供了一套工具,可以轻松地在单 HPU 和多 HPU 设置中加载、训练和推理各种下游任务的模型,如下表所示。
HPU 提供了快速的模型训练和推理,以及极佳的性价比。查看 这篇关于 BERT 预训练的博文 和 这篇对比英特尔 Gaudi 2 与 NVIDIA A100 GPU 的博文 以获取具体示例。如果您不熟悉 HPU,我们建议您查看 我们的概念指南。
以下模型架构、任务和设备分布已在适用于 Intel Gaudi 的 Optimum 中得到验证
在下表中,✅ 表示单卡、多卡和 DeepSpeed 均已通过验证。
- Transformers
架构 | 训练 | 推理 | 任务 |
---|---|---|---|
BERT | ✅ | ✅ | |
RoBERTa | ✅ | ✅ | |
ALBERT | ✅ | ✅ | |
DistilBERT | ✅ | ✅ | |
GPT2 | ✅ | ✅ | |
BLOOM(Z) | |||
StarCoder / StarCoder2 | ✅ | ||
GPT-J | |||
GPT-Neo | |||
GPT-NeoX | |||
OPT | |||
Llama 2 / CodeLlama / Llama 3 / Llama Guard / Granite | ✅ | ✅ | |
StableLM | |||
Falcon | ✅ | ||
CodeGen | |||
MPT | |||
Mistral | |||
Phi | ✅ | ||
Mixtral | |||
Gemma | ✅ | ||
Qwen2 | |||
Qwen2-MoE | |||
Persimmon | |||
T5 / Flan T5 | ✅ | ✅ | |
BART | |||
ViT | ✅ | ✅ | |
Swin | ✅ | ✅ | |
Wav2Vec2 | ✅ | ✅ | |
Whisper | ✅ | ✅ | |
SpeechT5 | |||
CLIP | ✅ | ✅ | |
BridgeTower | ✅ | ✅ | |
ESMFold | |||
Blip | |||
OWLViT | |||
ClipSeg | |||
Llava / Llava-next | |||
SAM | |||
VideoMAE | |||
TableTransformer | |||
DETR |
- Diffusers
架构 | 训练 | 推理 | 任务 |
---|---|---|---|
Stable Diffusion | |||
Stable Diffusion XL | |||
Stable Diffusion Depth2img | |||
LDM3D | |||
文本转视频 |
- PyTorch 图像模型/TIMM
架构 | 训练 | 推理 | 任务 |
---|---|---|---|
FastViT |
- TRL
架构 | 训练 | 推理 | 任务 |
---|---|---|---|
Llama 2 | ✅ | ||
Llama 2 | ✅ | ||
Stable Diffusion | ✅ |
其他受 🤗 Transformers 和 🤗 Diffusers 库支持的模型和任务也可能有效。您可以参考 此部分 以了解如何使用 🤗 Optimum Habana。此外,此页面 说明了如何修改 🤗 Transformers 库中的任何 示例 以使其与 🤗 Optimum Habana 协同工作。
< > 更新 在 GitHub 上