Inference Providers 文档
定价与账单
并获得增强的文档体验
开始使用
定价与账单
Inference Providers 是一项生产就绪的服务,涉及外部合作伙伴,因此是付费产品。但是,作为 Hugging Face 用户,您每月都会获得用于运行实验的信用额度。您获得的信用额度取决于您的帐户类型
等级 | 每月包含的信用额度 |
---|---|
免费用户 | 可能会有变动,少于 0.10 美元 |
PRO 用户 | $2.00 |
企业 Hub 组织 | 每个席位 2.00 美元,在成员之间共享 |
要享受 Enterprise Hub 包含的信用额度,您需要在执行推理请求时明确指定要计费的组织。有关更多详细信息,请参阅下面的组织账单部分。
按需付费
PRO 用户和企业 Hub 组织可以在每月包含的信用额度用完后继续使用 API。这种计费模式称为“按需付费” (PAYG),在每月订阅费用的基础上收取。PAYG 仅适用于与我们的计费系统集成的提供商。我们正在积极努力集成所有提供商,但在过渡期间,一旦达到免费层级限制,任何尚未集成的提供商都将被阻止。
如果您有剩余信用额度,我们会估算尚未完全与我们的计费系统集成的提供商的费用。这些估算通常高于实际成本,以防止滥用,这就是为什么目前对于这些提供商禁用 PAYG 的原因。
您可以在您的账单页面上跟踪您的支出。
Hugging Face 向您收取的费率与提供商相同,不收取额外费用。我们只是直接转嫁提供商的成本。
路由请求与直接调用
上面的文档假设您正在向外部提供商发出路由请求。实际上,有 3 种不同的方式来运行推理,每种方式都有独特的计费含义
路由请求:这是使用 Inference Providers 的默认方法。只需使用 JavaScript 或 Python
InferenceClient
,或使用您的 Hugging Face 用户访问令牌发出原始 HTTP 请求。您的请求将通过 Hugging Face 自动路由到提供商的平台。无需单独的提供商帐户,账单由 Hugging Face 直接管理。这种方法使您可以在提供商之间无缝切换,而无需额外的设置。使用自定义密钥的路由请求:在 Hub 上的设置页面中,您可以为每个提供商配置自定义密钥。要使用此选项,您需要在提供商的平台上创建一个帐户,账单将由该提供商直接处理。Hugging Face 不会向您收取调用费用。当您在 Hub 上试验模型时,此方法让您可以更好地控制账单。当使用自定义密钥发出路由请求时,您的代码保持不变——您仍然需要传递您的 Hugging Face 用户访问令牌。Hugging Face 将在路由请求时自动交换身份验证。
直接调用:如果您在使用 JavaScript 或 Python
InferenceClient
时提供自定义密钥,则调用将直接发送到提供商的平台。账单由提供商管理,Hugging Face 不会收到请求通知。如果您想使用统一的InferenceClient
接口而不通过 Hugging Face 路由,此选项是理想之选。
这是一个总结我们目前所见情况的表格
HF 路由 | 计费方 | 包含免费层级 | 按需付费 | 集成 | |
---|---|---|---|---|---|
路由请求 | 是 | Hugging Face | 是 | 仅适用于 PRO 用户和集成的提供商 | SDK、Playground、小部件、Data AI Studio |
使用自定义密钥的路由请求 | 是 | 提供商 | 否 | 是 | SDK、Playground、小部件、Data AI Studio |
直接调用 | 否 | 提供商 | 否 | 是 | 仅限 SDK |
HF-Inference 成本
您可能已经注意到,您可以选择使用 "hf-inference"
提供商。此服务在 Inference Providers 之前曾被称为“Inference API (无服务器)”。从用户的角度来看,使用 HF Inference 与使用任何其他提供商相同。超过免费层级信用额度后,您将根据计算时间 x 底层硬件的价格为每个推理请求付费。
例如,对 black-forest-labs/FLUX.1-dev 的请求在 GPU 机器上完成需要 10 秒,该 GPU 机器的运行成本为每秒 0.00012 美元,则将收取 0.0012 美元的费用。
"hf-inference"
提供商目前是在使用 JavaScript 和 Python SDK 时的默认提供商。请注意,此默认设置将来可能会更改。
组织账单
对于企业 Hub 组织,可以集中所有用户的账单。每个用户仍然使用自己的用户访问令牌,但请求将计入您的组织。这可以通过在 HTTP 请求中传递 "X-HF-Bill-To: my-org-name"
作为标头来完成。
企业 Hub 组织根据订阅中的席位数量获得免费使用信用额度池。Inference Providers 的使用情况可以在组织的账单页面上跟踪。企业 Hub 组织管理员还可以从组织的设置中设置支出限额并禁用一组 Inference Providers。


如果您正在使用 JavaScript InferenceClient
,您可以在客户端级别设置 billTo
属性
import { InferenceClient } from "@huggingface/inference";
const client = new InferenceClient("hf_token", { billTo: "my-org-name" });
const image = await client.textToImage({
model: "black-forest-labs/FLUX.1-schnell",
inputs: "A majestic lion in a fantasy forest",
provider: "fal-ai",
});
/// Use the generated image (it's a Blob)
Python 中也是如此
from huggingface_hub import InferenceClient
client = InferenceClient(provider="fal-ai", bill_to="my-org-name")
image = client.text_to_image(
"A majestic lion in a fantasy forest",
model="black-forest-labs/FLUX.1-schnell",
)
image.save("lion.png")