更新您的端点
您可以更新正在运行的端点以更改某些配置。但是,如果您的端点处于失败状态,则需要创建一个新的端点。要更新您的端点,您需要导航到“设置”选项卡。
您可以更新实例类型、自动缩放配置、任务和存储库版本。
实例大小
您可以在端点概述菜单中更新端点的实例大小以满足您不断变化的需求。例如,如果您不需要计算资源,可以缩减到较小的实例类型;或者,如果您需要增加计算资源,可以升级到较大的实例类型。
您可以更新您当前的实例类型:CPU 或 GPU。无法从一种实例类型更新到另一种实例类型(CPU 到 GPU 或反之亦然)。
自动缩放
您可以在设置菜单中更新端点的自动缩放配置。调整副本的最小和最大数量以扩展或缩减端点。了解更多关于自动缩放的信息,请点击此处。
任务
您可以在设置菜单中更新正在运行的端点的任务。任务定义了端点将使用的管道类型以及端点概述上的推理窗口小部件。
版本
您可以在设置菜单中更新正在运行的端点的版本。版本定义了您要用于推理的模型存储库的版本。
< > 更新 在 GitHub 上