Hugging Face 与 FriendliAI 合作,加速模型在 Hub 上的部署

发布于 2025 年 1 月 22 日
在 GitHub 上更新

FriendliAI 的推理基础架构现已作为 “Deploy this model (部署此模型)” 按钮中的一个选项集成到 Hugging Face Hub 中,从而简化并加速了生成式 AI 模型的服务。

Hugging Face and FriendliAI partner to supercharge model deployment on the Hub

携手合作,推动 AI 创新

Hugging Face 赋能开发者、研究人员和企业在 AI 领域进行创新。我们共同的优先事项是建立有影响力的合作伙伴关系,以简化工作流程,并为 AI 社区提供尖端工具。

今天,我们激动地宣布 Hugging Face 与 FriendliAI 建立合作伙伴关系。FriendliAI 是加速生成式 AI 推理领域的领导者,此次合作旨在提升开发者部署和管理 AI 模型的方式。本次集成将 FriendliAI Endpoints 作为 Hugging Face Hub 内的一个部署选项,为开发者提供直接访问高性能、高性价比的推理基础设施。

根据 Artificial Analysis 的评估,FriendliAI 被评为最快的基于 GPU 的生成式 AI 推理提供商,其拥有连续批处理、原生量化和业界领先的自动缩放等突破性技术。凭借这些技术,FriendliAI 不断提升 AI 推理服务的性能标准,为大规模部署生成式 AI 模型提供了更快的处理速度、更低的延迟和显著的成本节约。通过此次合作,Hugging Face 用户和 FriendliAI 客户可以轻松地以无与伦比的效率和可靠性部署开源或自定义的生成式 AI 模型。

简化模型部署

去年,FriendliAI 推出了 Hugging Face 集成,使用户能够在其 Friendli Suite 平台内无缝部署 Hugging Face 模型。通过此集成,用户可以访问 Hugging Face 上数千个受支持的开源模型,并能轻松部署私有模型。FriendliAI 当前支持的模型架构列表可在此处找到。

今天,我们进一步深化了这一集成,在 Hugging Face Hub 中直接实现了一键部署,为用户提供无缝的体验。你可以使用 Friendli Suite 帐户,直接从 Hugging Face Hub 的模型卡片上部署模型。

Friendli Inference deployment option in Hugging Face

选择 Friendli Endpoints 将带您进入 FriendliAI 的模型部署页面。在这里,您可以在 NVIDIA H100 GPU 上部署模型,同时与经过优化的开源模型进行交互。部署页面提供了一个直观的界面,用于设置 Friendli Dedicated Endpoints,这是用于生成式 AI 推理的托管服务。此外,在您的部署处理期间,您可以直接在页面上与开源模型聊天,从而轻松探索和测试其功能。

在 Friendli 专用端点中使用 NVIDIA H100 部署模型

凭借 FriendliAI 先进的 GPU 优化推理引擎,Dedicated Endpoints (专用端点) 作为托管服务提供快速且经济高效的推理。开发者只需在模型部署页面点击“立即部署”,即可使用 Friendli Dedicated Endpoints 在 NVIDIA H100 GPU 上轻松部署开源或自定义模型。

H100 GPU 功能强大,但大规模运营成本高昂。借助 FriendliAI 的优化服务,您可以在保持峰值性能的同时减少所需 GPU 的数量,从而显著降低成本。除了成本效益外,Dedicated Endpoints 还简化了管理基础设施的复杂性。

Deploy Hugging Face models in the model deployment page

使用 Friendli 无服务器端点对开源模型进行推理

对于希望高效地对开源模型进行推理的开发者来说,Friendli Serverless Endpoints 是完美的解决方案。该服务为经过 FriendliAI 优化的模型提供用户友好的 API,确保以低成本实现高性能。您可以在模型部署页面直接与这些强大的开源模型聊天。

Try out Serverless Endpoints in the model deployment page

下一步计划

我们很高兴能深化 FriendliAI 与 Hugging Face 的合作,为全球开发者提供更便捷的开源 AI 访问。FriendliAI 的高速、高性价比的推理解决方案消除了基础设施管理的复杂性,让用户能够专注于创新。我们将与 FriendliAI 一道,继续致力于改变 AI 的开发方式,推动塑造下一个 AI 时代的突破性创新。

您也可以在我们的组织页面上关注我们,以获取未来的最新消息 🔥

社区

好消息

注册登录以发表评论