optimum-tpu 文档
通过 GCloud CLI 部署和连接到 Google TPU 实例
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
通过 GCloud CLI 部署和连接到 Google TPU 实例
背景
我们假设读者已经创建了 Google Cloud Platform (GCP) 用户或组织帐户以及关联的项目。
我们还假设读者已经安装了 Google Cloud CLI。 如果没有,请按照后面的链接进行安装和设置。
在 GCP 上创建初始 TPU VM
为了创建您的初始 TPU 实例,您需要提供一些信息
总的来说,最终命令看起来像这样
gcloud compute tpus tpu-vm create <ref_instance_name> \ --zone=<deploiment_zone> \ --accelerator-type=<target_tpu_generation> \ --version=<runtime_version>
部署 TPU v5litepod-8 实例
在我们的示例中,我们将使用最新的 v2-alpha-tpuv5-lite
运行时版本,在 GCP 区域 us-west4-a
中部署一个名为 optimum-tpu-get-started
的 v5litepod-8 实例。
当然,您可以随意调整所有这些参数,以使其与您的使用情况和配额相匹配。
在创建实例之前,请确保安装 gcloud alpha component
组件,因为这是定位 TPUv5 VM 所必需的:gcloud components install alpha
gcloud alpha compute tpus tpu-vm create optimum-tpu-get-started \ --zone=us-west4-a \ --accelerator-type=v5litepod-8 \ --version=v2-alpha-tpuv5-lite
通过 ssh 连接到实例
gcloud compute tpus tpu-vm ssh <ref_instance_name> --zone=<deployment_zone> $ >
在上面部署 v5litepod-8 的示例中,它将类似于
gcloud compute tpus tpu-vm ssh optimum-tpu-get-started --zone=us-west4-a $ >
其他有用的命令
这用于获取有关 tpu-vm 的信息,例如其外部 IP
gcloud compute tpus tpu-vm describe --zone=<tpu_zone> <tpu_name>
下一步
- 如果您希望训练自己的模型,您现在可以安装 optimum-tpu
- 如果您希望进行服务部署,您可以查看我们的服务部署教程