api-inference 文档

速率限制

Hugging Face's logo
加入 Hugging Face 社区

并获得增强文档体验的访问权限

开始使用

速率限制

推理 API 基于请求数量具有速率限制。这些速率限制将来可能会更改为基于计算或基于令牌。

无服务器 API 不适用于繁重的生产应用程序。如果您需要更高的速率限制,请考虑使用推理端点 以获得专用资源。

您需要进行身份验证(传递令牌或通过您的浏览器)才能使用推理 API。

用户层级 速率限制
已注册用户 每天 1,000 个请求
PRO 和企业用户 每天 20,000 个请求
< > 在 GitHub 上更新