Inference Endpoints (专用) 文档

创建端点

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

创建端点

首次登录后,您将被定向到 端点创建页面。例如,本指南将介绍部署 distilbert/distilbert-base-uncased-finetuned-sst-2-english 以进行文本分类的步骤。

1. 输入 Hugging Face 仓库 ID 和您期望的端点名称

Create

2. 选择您的实例配置

选择云提供商、区域和实例类型。如果您正在寻找尚未提供的特定云提供商、区域或实例,请告知我们。

select region

3. 应用自动缩放到零

或将您的端点保持原样。

autoscaling

4. 定义端点的安全级别

define security

5. 自定义您的端点

您可以在“高级配置”中进一步自定义您的端点:副本自动缩放、任务、修订、框架和容器类型在此部分中均可访问。

advanced configuration

6. 创建您的端点

通过单击“创建端点”。显示的成本估算为每小时,不包括自动缩放。

create endpoint

7. 等待端点构建、初始化和运行

请注意,初始化时间取决于模型大小,通常需要 1 到 5 分钟。

running

8. 测试您的端点 🎉

这可以在您的端点概览中使用 Playground 🏁 实现!

playground < > 在 GitHub 上更新