Google Kubernetes Engine (GKE) 示例

此目录包含在 Google Kubernetes Engine (GKE) 中使用 Hugging Face 深度学习容器 (DLC) 的使用示例，用于训练和推理，重点关注大型语言模型 (LLM)。

训练示例

示例	标题
trl-full-fine-tuning	使用 PyTorch 训练 DLC 在 GKE 上使用 SFT 对 Gemma 2B 进行微调
trl-lora-fine-tuning	使用 PyTorch 训练 DLC 在 GKE 上使用 SFT + LoRA 对 Mistral 7B v0.3 进行微调

示例	标题
tei-deployment	在 GKE 上使用 TEI DLC 部署 Snowflake 的 Arctic Embed
tei-from-gcs-deployment	在 GKE 上使用 TEI DLC 从 GCS 部署 BGE Base v1.5
tgi-deployment	在 GKE 上使用 TGI DLC 部署 Meta Llama 3 8B
tgi-from-gcs-deployment	在 GKE 上使用 TGI DLC 从 GCS 部署 Qwen2 7B
tgi-llama-405b-deployment	在 GKE 上使用 TGI DLC 部署 Llama 3.1 405B
tgi-llama-vision-deployment	在 GKE 上使用 TGI DLC 部署 Llama 3.2 11B Vision
tgi-multi-lora-deployment	在 GKE 上使用 TGI DLC 部署带有多个 LoRA 适配器的 Gemma2

📍 在 GitHub 上找到完整的示例这里!