Optimum 文档
🤗 Optimum
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
🤗 Optimum
🤗 Optimum 是 Transformers 的扩展,提供了一套性能优化工具,可最大程度地高效训练和运行模型。
AI 生态系统发展迅速,每天都有越来越多的专业硬件及其各自的优化方案出现。因此,Optimum 使开发人员能够像使用 Transformers 一样轻松高效地使用这些平台中的任何一个。
🤗 Optimum 作为一系列软件包发布 - 请查看以下链接,深入了解每个软件包。
硬件合作伙伴
以下软件包可让您在各种设备上充分利用 🤗 Hugging Face 生态系统。
NVIDIA
在 NVIDIA 平台上使用 NVIDIA TensorRT-LLM 加速推理
AMD
为 AMD Instinct GPU 和 AMD Ryzen AI NPU 启用性能优化
Intel
使用 OpenVINO、Neural Compressor 和 IPEX 优化模型以加速推理
AWS Trainium/Inferentia
使用 AWS Trainium 和 AWS Inferentia 加速您的训练和推理工作流
Google TPUs
使用 Google TPUs 加速您的训练和推理工作流
Habana
使用 Habana 的 Gaudi 处理器 最大化训练吞吐量和效率
FuriosaAI
在 FuriosaAI WARBOY 上进行快速高效的推理
开源集成
🤗 Optimum 还支持各种开源框架,使模型优化变得非常简单。
< > 在 GitHub 上更新