推理端点(专用)文档

创建端点

Hugging Face's logo
加入 Hugging Face 社区

并获得增强型文档体验

开始使用

创建端点

首次登录后,您将被重定向到端点创建页面。例如,本指南将逐步介绍部署distilbert/distilbert-base-uncased-finetuned-sst-2-english进行文本分类的步骤。

1. 输入 Hugging Face 代码库 ID 和您所需的端点名称

Create

2. 选择您的实例配置

选择云提供商、区域和实例类型。如果您正在寻找尚未看到可用的特定云提供商、区域或实例,请告知我们。

select region

3. 应用自动缩容至零

或保持端点不变。

autoscaling

4. 定义端点的安全级别

define security

5. 自定义您的端点

您可以在高级配置中进一步自定义您的端点:此部分提供了副本自动扩展、任务、版本、框架和容器类型的访问权限。

advanced configuration

6. 创建您的端点

点击**创建端点**。显示的成本估算按小时计算,不考虑自动扩展。

create endpoint

7. 等待端点构建、初始化并运行

请注意,初始化时间取决于模型大小,通常需要 1 到 5 分钟。

running

8. 测试您的端点🎉

这可以通过您端点的概览利用 Playground 🏁 来实现!

playground < > 在 GitHub 上更新