optimum-tpu 文档

通过 GCloud CLI 部署和连接 Google TPU 实例

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

通过 GCloud CLI 部署和连接 Google TPU 实例

上下文

我们假设读者已经创建了 Google Cloud Platform (GCP) 用户或组织帐户以及关联的项目。

我们还假设读者已安装 Google Cloud CLI。如果没有,请按照以下链接进行安装设置

在 GCP 上创建初始 TPU VM

为了创建您的初始 TPU 实例,您需要提供一些信息

  • 您希望部署实例的 GCP 区域(例如,为了开发目的靠近读者,为了生产目的靠近最终用户)
  • 您希望针对哪种 TPU
  • 您希望在实例上利用的 TPU 运行时版本
  • 自定义实例名称,以便快速浏览和引用实例

总的来说,最终命令如下所示

gcloud compute tpus tpu-vm create <ref_instance_name> \
--zone=<deploiment_zone> \
--accelerator-type=<target_tpu_generation> \
--version=<runtime_version>

部署 TPU v5litepod-8 实例

在我们的例子中,我们将在 GCP 区域 us-west4-a 中部署名为 optimum-tpu-get-startedv5litepod-8 实例,使用最新的 v2-alpha-tpuv5-lite 运行时版本。

当然,请随意调整所有这些参数以匹配您的使用情况和配额。

在创建实例之前,请确保安装 gcloud alpha component,因为这是定位 TPUv5 VM 所必需的:gcloud components install alpha

gcloud alpha compute tpus tpu-vm create optimum-tpu-get-started \
--zone=us-west4-a \
--accelerator-type=v5litepod-8 \
--version=v2-alpha-tpuv5-lite

通过 ssh 连接到实例

gcloud compute tpus tpu-vm ssh <ref_instance_name> --zone=<deployment_zone>
$ >

在上面部署 v5litepod-8 的示例中,它会像这样

gcloud compute tpus tpu-vm ssh optimum-tpu-get-started --zone=us-west4-a
$ >

其他有用的命令

这用于获取有关 tpu-vm 的信息,例如其外部 IP

gcloud compute tpus tpu-vm describe --zone=<tpu_zone> <tpu_name>

下一步