隆重推出“训练集群即服务”——与 NVIDIA 的全新合作

发布于 2025 年 6 月 11 日
在 GitHub 上更新

今天,在 GTC 巴黎大会上,我们激动地宣布与 NVIDIA 合作推出“训练集群即服务” (Training Cluster as a Service),旨在让世界各地的研究机构能够更轻松地使用大型 GPU 集群,从而在各个领域训练未来的基础模型。

让 GPU 集群触手可及

许多吉瓦级 (Gigawatt-size) GPU 超级集群项目正在建设中,用于训练下一代 AI 模型。这似乎让“GPU 贫困”和“GPU 富裕”之间的算力差距迅速扩大。但实际上,随着超大规模云服务商、区域性云服务商和 AI 原生云提供商都在迅速扩大其容量,GPU 资源是存在的。

那么,我们如何将 AI 计算能力与需要它的研究人员联系起来?我们如何让世界各地的大学、国家研究实验室和公司能够构建自己的模型?

这正是 Hugging Face 和 NVIDIA 推出“训练集群即服务”所要解决的问题——提供 GPU 集群的可访问性,并能灵活地仅为训练期间的运行时长付费。

首先,Hugging Face 上的 25 万个组织中,任何一个都可以在需要时,申请所需规模的 GPU 集群。

工作原理

要开始使用,您可以在 hf.co/training-cluster 代表您的组织申请 GPU 集群。

“训练集群即服务”将 NVIDIA 和 Hugging Face 的关键组件整合成一个完整的解决方案。

  • NVIDIA 云合作伙伴在区域数据中心提供最新的 NVIDIA 加速计算能力,如 NVIDIA Hopper 和 NVIDIA GB200,所有这些都集中在 NVIDIA DGX Cloud 内。
  • NVIDIA DGX Cloud Lepton——今天在 GTC 巴黎大会上宣布——为研究人员提供了对已配置基础设施的便捷访问,并支持训练任务的调度和监控。
  • Hugging Face 的开发者资源和开源库使启动训练任务变得轻而易举。

一旦您的 GPU 集群请求被接受,Hugging Face 和 NVIDIA 将合作根据您的规模、区域和时长要求,为您采购、定价、配置和设置 GPU 集群。

运行中的集群

与 TIGEM 共同推进罕见遗传病研究

Telethon 基因组学与医学研究所 (简称 TIGEM) 是一个致力于理解罕见遗传病背后分子机制并开发新疗法的研究中心。训练新的 AI 模型是预测致病性变异影响和药物再利用的新途径。

AI 为研究罕见遗传病的病因和开发治疗方法提供了新途径,但我们的领域需要训练新的模型。‘训练集群即服务’让我们能够在恰当的时间轻松地获得所需的 GPU 计算能力。

-- Diego di Bernardo, TIGEM 基因组医学项目协调员

与 Numina 共同推进数学 AI 研究

Numina 是一个非营利组织,致力于为数学推理构建开源、开放数据集的 AI,并获得了 2024 年 AIMO 进步奖

我们正朝着构建顶级闭源模型 (如 Deepmind 的 AlphaProof) 的开放替代方案的目标稳步前进。计算资源是我们目前的瓶颈——有了‘训练集群即服务’,我们将能够实现我们的目标!

-- Yann Fleureau, Numina 项目联合创始人

与 Mirror Physics 共同推进材料科学研究

Mirror Physics 是一家为化学和材料科学创建前沿 AI 系统的初创公司。

我们与 MACE 团队一起,致力于推动化学领域 AI 的极限。借助‘训练集群即服务’,我们正在以前所未有的规模生产高保真化学模型。这将是该领域向前迈出的重要一步。

-- Sam Walton Norwood, Mirror 公司 CEO 兼创始人

为多样化的 AI 研究提供动力

“训练集群即服务”是 Hugging Face 和 NVIDIA 之间的一项新合作,旨在让全球 AI 研究社区更容易获得 AI 计算资源。

大规模、高性能的计算资源是构建跨领域、跨语言的下一代 AI 模型的关键。‘训练集群即服务’将为研究人员和公司消除障碍,释放他们训练最先进模型的能力,并推动 AI 领域的可能性边界。

-- Clément Delangue, Hugging Face 联合创始人兼 CEO

将 DGX Cloud Lepton 与 Hugging Face 的‘训练集群即服务’相结合,为开发者和研究人员提供了一种无缝的方式,可以跨越广泛的云提供商网络访问高性能的 NVIDIA GPU。这种合作使 AI 研究人员和组织能够更轻松地扩展其 AI 训练工作负载,同时使用 Hugging Face 上熟悉的工具。

-- Alexis Bjorlin, NVIDIA DGX Cloud 副总裁

与 NVIDIA 共同赋能 AI 构建者

我们很高兴能与 NVIDIA 合作,向 Hugging Face 组织提供“训练集群即服务”——您现在就可以在 hf.co/training-cluster 开始使用。

今天在 GTC 巴黎大会上,NVIDIA 宣布了许多针对 Hugging Face 用户的新贡献,从智能体到机器人!

社区

注册登录 以发表评论