Hugging Face Hub 文档
Hugging Face Hub 是一个拥有超过 90 万个模型、20 万个数据集和 30 万个演示应用程序(Spaces)的平台,所有这些都是开源的,并且在在线平台上公开可用,人们可以轻松地在其中协作并共同构建 ML。Hub 充当一个中心位置,任何人都可以在其中探索、实验、协作并使用机器学习构建技术。您准备好加入开源机器学习的道路了吗?🤗
什么是 Hugging Face Hub?
我们正在帮助社区共同努力,朝着推动机器学习的目标前进🔥。
Hugging Face Hub 是一个拥有超过 90 万个模型、20 万个数据集和 30 万个演示的平台,人们可以在其中轻松地在他们的 ML 工作流中进行协作。Hub 充当一个中心位置,任何人都可以在其中共享、探索、发现和试验开源机器学习。
没有一家公司,包括科技巨头,能够独自“解决人工智能”——我们实现这一目标的唯一途径是在以社区为中心的模式下共享知识和资源。我们正在 Hugging Face Hub 上构建最大的开源模型、数据集和演示集合,以使每个人都能够民主化和推动机器学习的发展🚀。
我们鼓励您阅读 行为准则 和 内容指南,以熟悉我们期望社区成员遵守的价值观🤗。
您可以在 Hub 上找到什么?
Hugging Face Hub 托管基于 Git 的存储库,它们是版本控制的存储桶,可以包含所有文件。💾
在上面,您将能够上传和发现…
- 模型,_托管 NLP、视觉和音频任务的最新最先进模型_
- 数据集,_提供各种适用于不同领域和模式的数据_。
- Spaces,_用于直接在您的浏览器中演示 ML 模型的交互式应用程序_。
Hub 提供**版本控制、提交历史记录、差异、分支以及十几个库集成**!您可以在**存储库文档**中了解有关所有存储库共享的这些功能的更多信息。
模型
您可以发现和使用社区共享的数万个开源 ML 模型。为了促进负责任的模型使用和开发,模型仓库配备了模型卡,以告知用户每个模型的局限性和偏差。可以包含有关其任务、语言和评估结果等信息的附加元数据,如果存储库包含TensorBoard 跟踪,还可以添加训练指标图表。将**推理部件**添加到您的模型也很容易,允许任何人直接在浏览器中使用该模型!为了进行编程访问,提供了一个无服务器 API 来**即时为您的模型提供服务**.
要将模型上传到 Hub,或下载模型并将其集成到您的工作中,请探索**模型文档**。您还可以从**十几个库**(如 🤗 Transformers、Asteroid 和 ESPnet)中选择,这些库支持 Hub。
数据集
Hub 是超过 8,000 种语言的 200,000 多个数据集的中心,这些数据集可用于 NLP、计算机视觉和音频等领域的各种任务。Hub 简化了数据集的查找、下载和上传。数据集附带丰富的文档,形式为 数据集卡片 和 数据集查看器,以便您直接在浏览器中浏览数据。虽然许多数据集是公开的,但 组织 和个人可以创建私有数据集,以符合许可或隐私问题。您可以了解有关 Hugging Face Hub 文档中的数据集 的更多信息。
🤗 datasets
库允许您以编程方式与数据集交互,因此您可以轻松地在项目中使用 Hub 中的数据集。只需一行代码,您就可以访问数据集;即使数据集非常大,无法放入您的计算机,您也可以使用流式传输来有效地访问数据。
Spaces
Spaces 是一种在 Hub 上托管 ML 演示应用程序的简单方法。它们允许您构建您的 ML 作品集,在会议或利益相关者面前展示您的项目,以及与 ML 生态系统中的其他人协作。
我们目前支持两个很棒的 Python SDK(Gradio 和 Streamlit),它们可以让您在几分钟内构建酷炫的应用程序。用户还可以创建静态 Spaces,它们是 Space 内的简单 HTML/CSS/JavaScript 页面。
在您探索了一些 Spaces 之后(看看我们的 每周 Space!),深入了解 Spaces 文档,了解有关如何创建自己的 Space 的所有信息。您还将能够升级您的 Space 以在 GPU 或其他加速硬件上运行。⚡️
组织
公司、大学和非营利组织是 Hugging Face 社区的重要组成部分!Hub 提供 组织,可用于分组帐户并管理数据集、模型和 Spaces。教育工作者还可以使用 面向课堂的 Hugging Face 为学生创建协作组织。组织的仓库将显示在组织页面上,组织的每个成员都将能够为仓库做出贡献。除了方便地将所有组织的工作分组外,Hub 还允许管理员设置角色以 控制对仓库的访问权限,并管理组织的 付款方式和账单信息。机器学习在协作时更有趣!🔥
探索现有组织,创建一个新的组织 在这里,然后访问 组织文档 了解更多信息。
安全
Hugging Face Hub 支持安全和访问控制功能,让您安心,您的代码、模型和数据安全无虞。访问这些文档中的 安全 部分以了解
- 用户访问令牌
- 组织的访问控制
- 使用 GPG 签署提交
- 恶意软件扫描