Google Cloud 文档

(预览) Cloud Run 示例

Hugging Face's logo
加入 Hugging Face 社区

并获得增强型文档体验

开始

(预览) Cloud Run 示例

此目录包含 Hugging Face 深度学习容器 (DLC) 在 Cloud Run 中的使用示例,目前仅用于推理,重点关注大型语言模型 (LLM)。

Cloud Run 现在提供对 NVIDIA L4 GPU 的按需访问,用于运行 AI 推理工作负载;但这仍然处于预览阶段,因此此存储库中的 Cloud Run 示例应仅用于测试和实验;请避免将这些示例用于生产工作负载。我们正在积极努力实现通用可用性,感谢您的理解。

推理示例

示例 标题
tgi-deployment 在 Cloud Run 上部署 Meta Llama 3.1 与 TGI DLC

📍 在 GitHub 上找到完整的示例 这里

< > 更新 在 GitHub 上