Hugging Face
模型
数据集
空间
帖子
文档
解决方案
定价
登录
注册
Optimum 文档
概述
Optimum
🏡 查看所有文档
AWS Trainium & Inferentia
加速
Amazon SageMaker
Argilla
AutoTrain
Bitsandbytes
聊天界面
竞赛
数据集查看器
数据集
扩散器
Distilabel
评估
Google Cloud
Google TPU
Gradio
集线器
Hub Python 库
Huggingface.js
推理 API(无服务器)
推理端点(专用)
排行榜
Optimum
PEFT
Safetensors
句子转换器
TRL
任务
文本嵌入推理
文本生成推理
分词器
转换器
Transformers.js
timm
搜索文档
主分支
v1.23.1
v1.22.0
v1.21.4
v1.20.0
v1.19.0
v1.18.1
v1.17.1
v1.16.2
v1.15.0
v1.14.0
v1.13.2
v1.12.0
v1.11.2
v1.10.1
v1.9.0
v1.8.6
v1.7.3
v1.6.4
v1.5.2
v1.4.1
v1.3.0
v1.2.3
v1.0.0
英文
概述
🤗 Optimum
安装
快速入门
笔记本
概念指南
量化
英伟达
AMD
英特尔
AWS Trainium/Inferentia
Google TPU
Habana
Furiosa
🤗 Optimum Furiosa
安装
操作指南
概述
建模
量化
参考
ONNX 运行时
导出器
BetterTransformer
Torch FX
LLM 量化
实用程序
您正在查看
主分支
版本,需要
从源代码安装
。如果您想使用常规的 pip 安装,请查看最新稳定版本 (
v1.23.1
)。
加入 Hugging Face 社区
并获得增强文档体验
协作模型、数据集和空间
使用加速推理获得更快的示例
在文档主题之间切换
注册
开始使用
概述
欢迎来到 🤗 Optimum Furiosa 操作指南!这些指南涵盖更高级的主题,将向您展示如何轻松获得 NPU 的最佳性能。
加速推理
量化
←
安装
建模
→
概述