无服务器推理 API
即时访问数千个机器学习模型,用于快速原型设计
探索文本、图像、语音等最流行的模型 - 所有这些都只需一个简单的 API 请求。构建、测试和实验,无需担心基础设施或设置。
为什么要使用推理 API?
无服务器推理 API 提供了一种快速且免费的方式来探索数千个模型以执行各种任务。无论您是为新的应用程序创建原型还是尝试机器学习功能,此 API 都可以让您即时访问跨多个领域的性能卓越的模型。
- 文本生成:包括大型语言模型和工具调用提示,生成和试验高质量的响应。
- 图像生成:轻松创建自定义图像,包括用于您自己风格的 LoRA。
- 文档嵌入:使用 SOTA 嵌入构建搜索和检索系统。
- 经典 AI 任务:用于文本分类、图像分类、语音识别等任务的即用型模型。
⚡ 快速且免费入门:推理 API 免费提供,PRO 用户享有更高的速率限制。对于生产需求,请探索 推理端点 以获取专用资源、自动缩放、高级安全功能等。
主要优势
- 🚀 即时原型设计:无需设置即可访问强大的模型。
- 🎯 多种用例:一个 API 用于文本、图像等。
- 🔧 开发者友好:简单的请求,快速的响应。
主要功能
- 利用来自不同开源库(转换器、句子转换器、适配器转换器、扩散器、timm 等)的 800,000 多个模型。
- 将模型用于各种任务,包括文本生成、图像生成、文档嵌入、命名实体识别、摘要、图像分类等。
- 通过使用 GPU 加速的模型来加速您的原型设计。
- 运行在生产环境中难以部署的超大型模型。
- 无需费力即可使用生产级平台:内置自动扩展、负载平衡和缓存。
内容
文档分为两个部分
- 入门了解如何使用推理 API 的基础知识。
- API 参考深入了解特定于任务的设置和参数。
推理游乐场
如果您想快速开始使用对话完成模型,请使用推理游乐场快速测试和比较模型与您的提示。
您是否认真考虑在您的组织中使用 AI?使用 Hugging Face 企业中心更快地构建。
< > 更新 在 GitHub 上