Optimum 文档
针对 Intel® Gaudi® AI 加速器优化的 Optimum
并获得增强的文档体验
开始使用
针对 Intel® Gaudi® AI 加速器优化的 Optimum
针对 Intel Gaudi AI 加速器的 Optimum 是 Hugging Face 库(Transformers、Diffusers、Accelerate 等)与 Intel Gaudi AI 加速器 (HPU) 之间的接口。它提供了一组工具,可以在单 HPU 和多 HPU 设置下轻松加载模型、进行训练和推理,以执行各种下游任务,如下表所示。
Intel Gaudi AI 加速器系列目前包括三代产品:Intel Gaudi 1、Intel Gaudi 2 和 Intel Gaudi 3。每台服务器配备 8 个设备,称为 Habana 处理单元 (HPU),Gaudi 3 提供 128GB 内存,Gaudi 2 提供 96GB 内存,第一代 Gaudi 提供 32GB 内存。有关底层硬件架构的更多详细信息,请查看 Gaudi 架构概述。Optimum for Intel Gaudi 库与所有三代 Gaudi 加速器完全兼容。
有关在 Gaudi 上运行工作负载的深入示例,请浏览以下博客文章
以下模型架构、任务和设备分布已针对 Optimum for Intel Gaudi 进行了验证
在下表中,✅ 表示单卡、多卡和 DeepSpeed 均已验证。
- Transformers
架构 | 训练 | 推理 | 任务 |
---|---|---|---|
BERT | ✅ | ✅ | |
RoBERTa | ✅ | ✅ | |
ALBERT | ✅ | ✅ | |
DistilBERT | ✅ | ✅ | |
GPT2 | ✅ | ✅ | |
BLOOM(Z) | |||
StarCoder / StarCoder2 | ✅ | ||
GPT-J | |||
GPT-Neo | |||
GPT-NeoX | |||
OPT | |||
Llama 2 / CodeLlama / Llama 3 / Llama Guard / Granite | ✅ | ✅ | |
StableLM | |||
Falcon | ✅ | ||
CodeGen | |||
MPT | |||
Mistral | |||
Phi | ✅ | ||
Mixtral | |||
Gemma | ✅ | ||
Gemma2 | ✅ | ||
Qwen2 | |||
Qwen2-MoE | |||
Persimmon | |||
XGLM | |||
Cohere | |||
T5 / Flan T5 | ✅ | ✅ | |
BART | |||
ViT | ✅ | ✅ | |
Swin | ✅ | ✅ | |
Wav2Vec2 | ✅ | ✅ | |
Whisper | ✅ | ✅ | |
SpeechT5 | |||
CLIP | ✅ | ✅ | |
BridgeTower | ✅ | ✅ | |
ESMFold | |||
Blip | |||
OWLViT | |||
ClipSeg | |||
Llava / Llava-next | |||
Paligemma | |||
idefics2 | |||
SAM | |||
VideoMAE | |||
TableTransformer | |||
DETR | |||
Mllama | ✅ | ||
Video-LLaVA | |||
MiniCPM3 | |||
Baichuan2 | |||
DeepSeek-V2 | ✅ | ✅ | |
DeepSeek-V3 | ✅ | ||
ChatGLM | |||
Qwen2-VL |
- Diffusers
架构 | 训练 | 推理 | 任务 |
---|---|---|---|
Stable Diffusion | |||
Stable Diffusion XL | |||
Stable Diffusion Depth2img | |||
LDM3D | |||
FLUX.1 | |||
文本到视频 | |||
i2vgen-xl |
- PyTorch 图像模型/TIMM
架构 | 训练 | 推理 | 任务 |
---|---|---|---|
FastViT |
- TRL
架构 | 训练 | 推理 | 任务 |
---|---|---|---|
Llama 2 | ✅ | ||
Llama 2 | ✅ | ||
Stable Diffusion | ✅ |
🤗 Transformers 和 🤗 Diffusers 库支持的其他模型和任务也可能适用。您可以参考此部分,了解如何将它们与 🤗 Optimum for Intel Gaudi 结合使用。此外,此页面解释了如何修改 🤗 Transformers 库中的任何示例,使其与 🤗 Optimum for Intel Gaudi 配合使用。
< > 在 GitHub 上更新