Inference Providers 文档

定价与账单

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

定价与账单

Inference Providers 是一项生产就绪的服务,涉及外部合作伙伴,因此是付费产品。但是,作为 Hugging Face 用户,您每月都会获得用于运行实验的信用额度。您获得的信用额度取决于您的帐户类型

等级 每月包含的信用额度
免费用户 可能会有变动,少于 0.10 美元
PRO 用户 $2.00
企业 Hub 组织 每个席位 2.00 美元,在成员之间共享

要享受 Enterprise Hub 包含的信用额度,您需要在执行推理请求时明确指定要计费的组织。有关更多详细信息,请参阅下面的组织账单部分

按需付费

PRO 用户和企业 Hub 组织可以在每月包含的信用额度用完后继续使用 API。这种计费模式称为“按需付费” (PAYG),在每月订阅费用的基础上收取。PAYG 仅适用于与我们的计费系统集成的提供商。我们正在积极努力集成所有提供商,但在过渡期间,一旦达到免费层级限制,任何尚未集成的提供商都将被阻止。

如果您有剩余信用额度,我们会估算尚未完全与我们的计费系统集成的提供商的费用。这些估算通常高于实际成本,以防止滥用,这就是为什么目前对于这些提供商禁用 PAYG 的原因。

您可以在您的账单页面上跟踪您的支出。

Hugging Face 向您收取的费率与提供商相同,不收取额外费用。我们只是直接转嫁提供商的成本。

路由请求与直接调用

上面的文档假设您正在向外部提供商发出路由请求。实际上,有 3 种不同的方式来运行推理,每种方式都有独特的计费含义

  • 路由请求:这是使用 Inference Providers 的默认方法。只需使用 JavaScript 或 Python InferenceClient,或使用您的 Hugging Face 用户访问令牌发出原始 HTTP 请求。您的请求将通过 Hugging Face 自动路由到提供商的平台。无需单独的提供商帐户,账单由 Hugging Face 直接管理。这种方法使您可以在提供商之间无缝切换,而无需额外的设置。

  • 使用自定义密钥的路由请求:在 Hub 上的设置页面中,您可以为每个提供商配置自定义密钥。要使用此选项,您需要在提供商的平台上创建一个帐户,账单将由该提供商直接处理。Hugging Face 不会向您收取调用费用。当您在 Hub 上试验模型时,此方法让您可以更好地控制账单。当使用自定义密钥发出路由请求时,您的代码保持不变——您仍然需要传递您的 Hugging Face 用户访问令牌。Hugging Face 将在路由请求时自动交换身份验证。

  • 直接调用:如果您在使用 JavaScript 或 Python InferenceClient 时提供自定义密钥,则调用将直接发送到提供商的平台。账单由提供商管理,Hugging Face 不会收到请求通知。如果您想使用统一的 InferenceClient 接口而不通过 Hugging Face 路由,此选项是理想之选。

这是一个总结我们目前所见情况的表格

HF 路由 计费方 包含免费层级 按需付费 集成
路由请求 Hugging Face 仅适用于 PRO 用户和集成的提供商 SDK、Playground、小部件、Data AI Studio
使用自定义密钥的路由请求 提供商 SDK、Playground、小部件、Data AI Studio
直接调用 提供商 仅限 SDK

HF-Inference 成本

您可能已经注意到,您可以选择使用 "hf-inference" 提供商。此服务在 Inference Providers 之前曾被称为“Inference API (无服务器)”。从用户的角度来看,使用 HF Inference 与使用任何其他提供商相同。超过免费层级信用额度后,您将根据计算时间 x 底层硬件的价格为每个推理请求付费。

例如,对 black-forest-labs/FLUX.1-dev 的请求在 GPU 机器上完成需要 10 秒,该 GPU 机器的运行成本为每秒 0.00012 美元,则将收取 0.0012 美元的费用。

"hf-inference" 提供商目前是在使用 JavaScript 和 Python SDK 时的默认提供商。请注意,此默认设置将来可能会更改。

组织账单

对于企业 Hub 组织,可以集中所有用户的账单。每个用户仍然使用自己的用户访问令牌,但请求将计入您的组织。这可以通过在 HTTP 请求中传递 "X-HF-Bill-To: my-org-name" 作为标头来完成。

企业 Hub 组织根据订阅中的席位数量获得免费使用信用额度池。Inference Providers 的使用情况可以在组织的账单页面上跟踪。企业 Hub 组织管理员还可以从组织的设置中设置支出限额并禁用一组 Inference Providers。

如果您正在使用 JavaScript InferenceClient,您可以在客户端级别设置 billTo 属性

import { InferenceClient } from "@huggingface/inference";

const client = new InferenceClient("hf_token", { billTo: "my-org-name" });

const image = await client.textToImage({
	model: "black-forest-labs/FLUX.1-schnell",
	inputs: "A majestic lion in a fantasy forest",
	provider: "fal-ai",
});
/// Use the generated image (it's a Blob)

Python 中也是如此

from huggingface_hub import InferenceClient
client = InferenceClient(provider="fal-ai", bill_to="my-org-name")
image = client.text_to_image(
    "A majestic lion in a fantasy forest",
    model="black-forest-labs/FLUX.1-schnell",
)
image.save("lion.png")
< > 更新 在 GitHub 上