Optimum 文档
🤗 Optimum
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
🤗 Optimum
🤗 Optimum 是 Transformers 的扩展,提供了一套性能优化工具,以便在目标硬件上以最高效率训练和运行模型。
人工智能生态系统发展迅速,越来越多的专用硬件及其自身的优化 不断 涌现。因此,Optimum 使开发人员能够像使用 Transformers 一样轻松高效地使用任何这些平台。
🤗 Optimum 以软件包集合的形式分发 - 查看以下链接以深入了解每个软件包。
硬件合作伙伴
以下软件包使您能够在各种类型的设备上充分利用 🤗 Hugging Face 生态系统。
NVIDIA
在 NVIDIA 平台上使用 NVIDIA TensorRT-LLM 加速推理
AMD
为 AMD Instinct GPU 和 AMD Ryzen AI NPU 启用性能优化
Intel
优化您的模型,以使用 OpenVINO、Neural Compressor 和 IPEX 加速推理
AWS Trainium/Inferentia
使用 AWS Trainium 和 AWS Inferentia 加速您的训练和推理工作流程
Google TPUs
使用 Google TPU 加速您的训练和推理工作流程
Habana
使用 Habana 的 Gaudi 处理器最大化训练吞吐量和效率
FuriosaAI
在 FuriosaAI WARBOY 上实现快速高效的推理
开源集成
🤗 Optimum 还支持各种开源框架,以使模型优化非常容易。
< > 在 GitHub 上更新