Hugging Face
模型
数据集
空间
帖子
文档
解决方案
定价
登录
注册
Optimum 文档
笔记本
Optimum
🏡 查看所有文档
AWS Trainium & Inferentia
加速
Amazon SageMaker
Argilla
AutoTrain
Bitsandbytes
聊天界面
竞赛
数据集查看器
数据集
扩散器
Distilabel
评估
Google Cloud
Google TPU
Gradio
中心
Hub Python 库
Huggingface.js
推理 API(无服务器)
推理端点(专用)
排行榜
Optimum
PEFT
Safetensors
句子转换器
TRL
任务
文本嵌入推理
文本生成推理
分词器
转换器
Transformers.js
timm
搜索文档
主分支
v1.23.1
v1.22.0
v1.21.4
v1.20.0
v1.19.0
v1.18.1
v1.17.1
v1.16.2
v1.15.0
v1.14.0
v1.13.2
v1.12.0
v1.11.2
v1.10.1
v1.9.0
v1.8.6
v1.7.3
v1.6.4
v1.5.2
v1.4.1
v1.3.0
v1.2.3
v1.0.0
英文
概述
🤗 Optimum
安装
快速入门
笔记本
概念指南
量化
英伟达
AMD
英特尔
🤗 Optimum 英特尔
安装
神经压缩器
OpenVINO
IPEX
推理
支持的模型
教程
笔记本
AWS Trainium/Inferentia
Google TPU
Habana
Furiosa
ONNX 运行时
导出器
BetterTransformer
Torch FX
LLM 量化
实用程序
您正在查看
主分支
版本,需要
从源代码安装
。如果您希望使用常规 pip 安装,请查看最新稳定版本 (
v1.23.1
)。
加入 Hugging Face 社区
并获得增强文档体验
协作模型、数据集和空间
使用加速推理获得更快的示例
在文档主题之间切换
注册
开始使用
笔记本
推理
笔记本
描述
如何使用 IPEX 进行推理
解释如何将您的模型导出到 IPEX 并在文本生成任务上使用 IPEX 模型进行推理
<
>
更新
在 GitHub 上
←
支持的模型
🤗 Optimum Neuron
→
笔记本
推理