Inference Endpoints (dedicated) 文档
暂停和恢复您的 Endpoint
并获得增强的文档体验
开始使用
暂停和恢复您的 Endpoint
您可以 暂停
和 恢复
endpoints 以节省成本和配置。请注意,如果您的 endpoint 处于 failed
状态,您将需要创建一个新的 endpoint。要 暂停
/恢复
您的 endpoint,请导航到“概述”选项卡,然后单击右上角的按钮,该按钮将显示“暂停 endpoint”以暂停,或“恢复 endpoint”以重新激活已暂停的 endpoint。
暂停 endpoint 时,最小和最大副本数将设置为 0。恢复 endpoint 时,最小和最大副本数将设置为 1。这允许您通过更新 API 中的“min_replicas”和“max_replicas”字段以编程方式暂停和恢复您的 endpoint。已暂停的推理 endpoints 将具有以下状态:PAUSED
。已暂停的 endpoints 在恢复之前不会被计费。当您不需要 endpoint 运行时,暂停和恢复 endpoint 是节省成本的好方法。例如,您可以轻松地在夜间或周末暂停您的 endpoint。当您暂时不需要您的 endpoint 时,您应该暂停它。
即使您暂停并恢复 endpoint,您的 endpoint 的 URL 也将保持不变。这意味着您可以暂停您的 endpoint 并在以后恢复它,而无需更新您的代码。
暂停推理 Endpoint
要暂停 endpoint,请导航到“概述”选项卡,然后单击右上角的按钮,该按钮显示“暂停 endpoint”。

单击按钮后,系统将要求您确认操作。单击“暂停 {ENDPOINT-NAME}”以确认。

之后,您的副本数将设置为 0,并且您的 endpoint 将被暂停。您可以在“概述”选项卡中看到您的 endpoint 的状态更改为 PAUSED
。如果您没有看到 PAUSED
状态,请确保您已按照这些说明操作,或联系我们寻求帮助。

恢复推理 Endpoint
要恢复 endpoint,请导航到“概述”选项卡,然后单击右上角显示“恢复 endpoint”的按钮。

您的 endpoint 将被恢复,状态将更改为 Initalizing
,然后更改为 Running
。一旦您的 endpoint 正在运行,您可以再次开始使用它,并且将产生计费用量。