推理端点(专用)文档

暂停和恢复您的端点

Hugging Face's logo
加入 Hugging Face 社区

并获取增强型文档体验

开始使用

暂停和恢复您的端点

您可以 暂停恢复 端点以节省成本和配置。请注意,如果您的端点处于 失败 状态,您需要创建一个新的端点。要 暂停/恢复 您的端点,请导航到“概述”选项卡,然后点击右上角的按钮,该按钮将显示“暂停端点”以暂停,或“恢复端点”以重新激活暂停的端点。

暂停端点时,副本的最小值和最大值将设置为 0。恢复端点时,副本的最小值和最大值将设置为 1。这使您能够通过在 API 中更新“min_replicas”和“max_replicas”字段来以编程方式暂停和恢复您的端点。暂停的推理端点将具有以下状态:已暂停。暂停的端点将不会计费,直到恢复。暂停和恢复端点是当您不需要端点运行时节省成本的好方法。例如,您可以在晚上或周末轻松地暂停您的端点。当您暂时不需要端点时,您应该暂停端点。

即使您暂停和恢复端点,端点的 URL 也会保持不变。这意味着您可以暂停端点并在以后恢复端点,而无需更新代码。

暂停推理端点

要暂停端点,请导航到“概述”选项卡,然后点击右上角显示“暂停端点”的按钮。

Pause an Inference Endpoint

点击按钮后,系统会要求您确认操作。点击“暂停 {ENDPOINT-NAME}”以确认。

Pause modal confirm Inference Endpoint

之后,您的副本将被设置为 0,您的端点将被暂停。您可以在“概述”选项卡中查看您的端点状态更改为 已暂停。如果您没有看到 已暂停 状态,请确保您已按照这些说明进行操作,或联系我们以寻求帮助。

Paused Inference Endpoint

恢复推理端点

要恢复端点,请导航到“概述”选项卡,然后点击右上角显示“恢复端点”的按钮。

Resume Inference Endpoint

您的端点将被恢复,状态将变为 正在初始化,然后变为 正在运行。端点运行后,您可以再次开始使用它,并且将产生计费使用情况。

< > 更新 在 GitHub 上