文本嵌入推理文档

部署私有和受限模型

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

部署私有和受限模型

如果您希望部署的模型受限于访问权限或位于 Hugging Face Hub 上的私有模型库中,您将需要拥有访问该模型的权限才能部署它。

确认您已拥有模型的访问权限后

如果您使用的是 CLI,请设置 `HF_TOKEN` 环境变量。例如:

export HF_TOKEN=<YOUR READ TOKEN>

或者,您可以在使用 Docker 部署模型时提供令牌

model=<your private model>
volume=$PWD/data
token=<your cli Hugging Face Hub token>

docker run --gpus all -e HF_TOKEN=$token -p 8080:80 -v $volume:/data --pull always ghcr.io/huggingface/text-embeddings-inference:1.8 --model-id $model
< > 在 GitHub 上更新