推理端点(专用)文档

创建端点

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

创建端点

首次登录后,您将被定向到端点创建页面。举例来说,本指南将介绍部署distilbert/distilbert-base-uncased-finetuned-sst-2-english以进行文本分类的步骤。

1. 输入 Hugging Face 仓库 ID 和您想要的端点名称

Create

2. 选择您的实例配置

选择云提供商、区域和实例类型。如果您正在寻找特定但尚未提供的云提供商、区域或实例,请告知我们。

select region

3. 应用自动缩放至零

或者保持您的端点不变。

autoscaling

4. 定义端点的安全级别

define security

5. 自定义您的端点

您可以在高级配置中进一步自定义您的端点:副本自动缩放、任务、版本、框架和容器类型都可以在本节中访问。

advanced configuration

6. 创建您的端点

点击创建端点。显示的成本估算为每小时,不考虑自动扩缩。

create endpoint

7. 等待端点构建、初始化和运行

请注意,初始化时间取决于模型大小,通常需要 1 到 5 分钟。

running

8. 测试您的端点 🎉

您可以在端点概览中利用 Playground 🏁 进行测试!

playground < > 在 GitHub 上更新