optimum-tpu 文档

通过 GCloud CLI 部署和连接到 Google TPU 实例

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

通过 GCloud CLI 部署和连接到 Google TPU 实例

背景

我们假设读者已经创建了 Google Cloud Platform (GCP) 用户或组织帐户以及关联的项目。

我们还假设读者已经安装了 Google Cloud CLI。 如果没有,请按照后面的链接进行安装设置

在 GCP 上创建初始 TPU VM

为了创建您的初始 TPU 实例,您需要提供一些信息

  • 您希望实例部署到的 GCP 区域(例如,为了开发目的靠近读者,为了生产目的靠近最终用户)
  • 您想要定位哪种 TPU
  • 您希望在实例上利用哪个版本的 TPU 运行时
  • 自定义实例名称,以便快速浏览和回顾实例

总的来说,最终命令看起来像这样

gcloud compute tpus tpu-vm create <ref_instance_name> \
--zone=<deploiment_zone> \
--accelerator-type=<target_tpu_generation> \
--version=<runtime_version>

部署 TPU v5litepod-8 实例

在我们的示例中,我们将使用最新的 v2-alpha-tpuv5-lite 运行时版本,在 GCP 区域 us-west4-a 中部署一个名为 optimum-tpu-get-started 的 v5litepod-8 实例。

当然,您可以随意调整所有这些参数,以使其与您的使用情况和配额相匹配。

在创建实例之前,请确保安装 gcloud alpha component 组件,因为这是定位 TPUv5 VM 所必需的:gcloud components install alpha

gcloud alpha compute tpus tpu-vm create optimum-tpu-get-started \
--zone=us-west4-a \
--accelerator-type=v5litepod-8 \
--version=v2-alpha-tpuv5-lite

通过 ssh 连接到实例

gcloud compute tpus tpu-vm ssh <ref_instance_name> --zone=<deployment_zone>
$ >

在上面部署 v5litepod-8 的示例中,它将类似于

gcloud compute tpus tpu-vm ssh optimum-tpu-get-started --zone=us-west4-a
$ >

其他有用的命令

这用于获取有关 tpu-vm 的信息,例如其外部 IP

gcloud compute tpus tpu-vm describe --zone=<tpu_zone> <tpu_name>

下一步