api-inference 文档

无服务器推理 API

Hugging Face's logo
加入 Hugging Face 社区

并获得增强型文档体验

开始使用

无服务器推理 API

即时访问数千个机器学习模型,用于快速原型设计

探索文本、图像、语音等最流行的模型 - 所有这些都只需一个简单的 API 请求。构建、测试和实验,无需担心基础设施或设置。


为什么要使用推理 API?

无服务器推理 API 提供了一种快速且免费的方式来探索数千个模型以执行各种任务。无论您是为新的应用程序创建原型还是尝试机器学习功能,此 API 都可以让您即时访问跨多个领域的性能卓越的模型。

  • 文本生成:包括大型语言模型和工具调用提示,生成和试验高质量的响应。
  • 图像生成:轻松创建自定义图像,包括用于您自己风格的 LoRA。
  • 文档嵌入:使用 SOTA 嵌入构建搜索和检索系统。
  • 经典 AI 任务:用于文本分类、图像分类、语音识别等任务的即用型模型。

快速且免费入门:推理 API 免费提供,PRO 用户享有更高的速率限制。对于生产需求,请探索 推理端点 以获取专用资源、自动缩放、高级安全功能等。


主要优势

  • 🚀 即时原型设计:无需设置即可访问强大的模型。
  • 🎯 多种用例:一个 API 用于文本、图像等。
  • 🔧 开发者友好:简单的请求,快速的响应。

主要功能

  • 利用来自不同开源库(转换器、句子转换器、适配器转换器、扩散器、timm 等)的 800,000 多个模型。
  • 将模型用于各种任务,包括文本生成、图像生成、文档嵌入、命名实体识别、摘要、图像分类等。
  • 通过使用 GPU 加速的模型来加速您的原型设计。
  • 运行在生产环境中难以部署的超大型模型。
  • 无需费力即可使用生产级平台:内置自动扩展、负载平衡和缓存。

内容

文档分为两个部分

  • 入门了解如何使用推理 API 的基础知识。
  • API 参考深入了解特定于任务的设置和参数。


推理游乐场

如果您想快速开始使用对话完成模型,请使用推理游乐场快速测试和比较模型与您的提示。


您是否认真考虑在您的组织中使用 AI?使用 Hugging Face 企业中心更快地构建。

Hugging Face Enterprise Hub
< > 更新 在 GitHub 上