🤗 Optimum
🤗 Optimum 是 Transformers 的扩展,它提供了一套性能优化工具,以便在目标硬件上以最大效率训练和运行模型。
人工智能生态系统发展迅速,越来越多的专用硬件及其自身的优化技术每天都在涌现。因此,Optimum 使开发人员能够轻松地使用任何这些平台,就像使用 Transformers 一样。
🤗 Optimum 以一组软件包的形式分发——查看下面的链接以深入了解每个软件包。
硬件合作伙伴
以下软件包使您能够在各种类型的设备上获得 🤗 Hugging Face 生态系统的最佳体验。
NVIDIA
在 NVIDIA 平台 上使用 NVIDIA TensorRT-LLM 加速推理
AMD
为 AMD Instinct GPU 和 AMD Ryzen AI NPU 启用性能优化
Intel
优化您的模型以使用 OpenVINO、Neural Compressor 和 IPEX 加速推理
AWS Trainium/Inferentia
使用 AWS Trainium 和 AWS Inferentia 加速您的训练和推理工作流程
Google TPU
使用 Google TPU 加速您的训练和推理工作流程
Habana
使用 Habana 的 Gaudi 处理器 最大限度地提高训练吞吐量和效率
FuriosaAI
在 FuriosaAI WARBOY 上进行快速高效的推理
一些软件包提供与硬件无关的功能(例如,Optimum Intel 中的 INC 接口)。
开源集成
🤗 Optimum 还支持各种开源框架,使模型优化变得非常容易。
< > 更新 在 GitHub 上