optimum-tpu 文档
通过 GCloud CLI 部署和连接 Google TPU 实例
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
通过 GCloud CLI 部署和连接 Google TPU 实例
上下文
我们假设读者已经创建了 Google Cloud Platform (GCP) 用户或组织帐户以及关联的项目。
我们还假设读者已安装 Google Cloud CLI。如果没有,请按照以下链接进行安装和设置。
在 GCP 上创建初始 TPU VM
为了创建您的初始 TPU 实例,您需要提供一些信息
总的来说,最终命令如下所示
gcloud compute tpus tpu-vm create <ref_instance_name> \ --zone=<deploiment_zone> \ --accelerator-type=<target_tpu_generation> \ --version=<runtime_version>
部署 TPU v5litepod-8 实例
在我们的例子中,我们将在 GCP 区域 us-west4-a
中部署名为 optimum-tpu-get-started
的 v5litepod-8
实例,使用最新的 v2-alpha-tpuv5-lite
运行时版本。
当然,请随意调整所有这些参数以匹配您的使用情况和配额。
在创建实例之前,请确保安装 gcloud alpha component
,因为这是定位 TPUv5 VM 所必需的:gcloud components install alpha
gcloud alpha compute tpus tpu-vm create optimum-tpu-get-started \ --zone=us-west4-a \ --accelerator-type=v5litepod-8 \ --version=v2-alpha-tpuv5-lite
通过 ssh 连接到实例
gcloud compute tpus tpu-vm ssh <ref_instance_name> --zone=<deployment_zone> $ >
在上面部署 v5litepod-8 的示例中,它会像这样
gcloud compute tpus tpu-vm ssh optimum-tpu-get-started --zone=us-west4-a $ >
其他有用的命令
这用于获取有关 tpu-vm 的信息,例如其外部 IP
gcloud compute tpus tpu-vm describe --zone=<tpu_zone> <tpu_name>
下一步
- 如果您希望训练自己的模型,现在可以安装 optimum-tpu
- 如果您希望进行服务,可以查看我们的服务教程