Optimum 文档
Optimum for Intel® Gaudi® AI 加速器
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
Optimum for Intel® Gaudi® AI 加速器
Optimum for Intel Gaudi AI 加速器是 Hugging Face 库(Transformers、Diffusers、Accelerate 等)与 Intel Gaudi AI 加速器 (HPU) 之间的接口。它提供了一套工具,使得在单 HPU 和多 HPU 设置上,针对各种下游任务都能轻松实现模型加载、训练和推理,如下表所示。
Intel Gaudi AI 加速器系列目前包括三代产品:Intel Gaudi 1、Intel Gaudi 2 和 Intel Gaudi 3。每台服务器都配备 8 个设备,称为 Habana 处理单元 (HPU),Gaudi 3 提供 128GB 内存,Gaudi 2 提供 96GB,第一代 Gaudi 提供 32GB。有关底层硬件架构的更多详细信息,请查阅 Gaudi 架构概述。Optimum for Intel Gaudi 库与所有三代 Gaudi 加速器完全兼容。
有关在 Gaudi 上运行工作负载的深入示例,请浏览以下博客文章
以下模型架构、任务和设备分布已通过 Optimum for Intel Gaudi 验证
下表中,✅ 表示单卡、多卡和 DeepSpeed 均已通过验证。
- Transformers
| 架构 | 训练 | 推理 | 任务 |
|---|---|---|---|
| BERT | ✅ | ✅ | |
| RoBERTa | ✅ | ✅ | |
| ALBERT | ✅ | ✅ | |
| DistilBERT | ✅ | ✅ | |
| GPT2 | ✅ | ✅ | |
| BLOOM(Z) | |||
| StarCoder / StarCoder2 | ✅ | ||
| GPT-J | |||
| GPT-Neo | |||
| GPT-NeoX | |||
| OPT | |||
| Llama 2 / CodeLlama / Llama 3 / Llama Guard / Granite | ✅ | ✅ | |
| StableLM | |||
| Falcon | ✅ | ||
| CodeGen | |||
| MPT | |||
| Mistral | |||
| Phi | ✅ | ||
| Mixtral | |||
| Gemma | ✅ | ||
| Gemma2 | ✅ | ||
| Qwen2 / Qwen3 | |||
| Qwen2-MoE | |||
| Persimmon | |||
| XGLM | |||
| Cohere | |||
| T5 / Flan T5 | ✅ | ✅ | |
| BART | |||
| ViT | ✅ | ✅ | |
| Swin | ✅ | ✅ | |
| Wav2Vec2 | ✅ | ✅ | |
| Whisper | ✅ | ✅ | |
| SpeechT5 | |||
| CLIP | ✅ | ✅ | |
| BridgeTower | ✅ | ✅ | |
| ESMFold | |||
| Blip | |||
| OWLViT | |||
| ClipSeg | |||
| Llava / Llava-next / Llava-onevision | |||
| Paligemma | |||
| idefics2 | |||
| SAM | |||
| VideoMAE | |||
| TableTransformer | |||
| DETR | |||
| Mllama | ✅ | ||
| Video-LLaVA | |||
| MiniCPM3 | |||
| Baichuan2 | |||
| DeepSeek-V2 | ✅ | ✅ | |
| DeepSeek-V3 / Moonlight | ✅ | ||
| ChatGLM | |||
| Qwen2-VL | |||
| GLM-4V |
- Diffusers
| 架构 | 训练 | 推理 | 任务 |
|---|---|---|---|
| Stable Diffusion | ✅ | ✅ | |
| Stable Diffusion XL | ✅ | ✅ | |
| Stable Diffusion Depth2img | |||
| Stable Diffusion 3 | ✅ | ||
| LDM3D | |||
| FLUX.1 | |||
| 文本到视频 | |||
| 图像到视频 | |||
| i2vgen-xl |
- PyTorch 图像模型/TIMM
| 架构 | 训练 | 推理 | 任务 |
|---|---|---|---|
| FastViT |
- TRL
| 架构 | 训练 | 推理 | 任务 |
|---|---|---|---|
| Llama 2 | ✅ | ||
| Llama 2 | ✅ | ||
| Stable Diffusion | ✅ |
🤗 Transformers 和 🤗 Diffusers 库支持的其他模型和任务也可能有效。您可以参考此部分,了解如何将其与 🤗 Optimum for Intel Gaudi 结合使用。此外,此页面解释了如何修改 🤗 Transformers 库中的任何示例,使其与 🤗 Optimum for Intel Gaudi 兼容。
< > 在 GitHub 上更新