Hub 文档

🟧 Spaces 上的 Label Studio

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

🟧 Spaces 上的 Label Studio

Label Studio 是一个开源数据标注平台,用于标注、注释和探索多种不同数据类型。此外,Label Studio 还包含一个强大的机器学习接口,可用于新模型训练、主动学习、监督学习以及许多其他训练技术。

本指南将教你如何在使用 Hugging Face Hub 内部署 Label Studio 以进行数据标注和注释。你可以将 Label Studio 的默认配置作为完全托管在 Hub 上的独立应用程序,使用 Docker 进行演示和评估,或者你可以连接自己的数据库和云存储,以在 Spaces 上托管一个功能齐全的生产就绪应用程序。

⚡️ 在 Spaces 上部署 Label Studio

你可以通过几次点击在 Spaces 上部署 Label Studio

Spaces 要求你定义:

  • 一个 所有者:你的个人账户或你所属的组织。

  • 一个 Space 名称:你在创建 Space 的账户中给 Space 起的名称。

  • 可见性:如果你希望 Space 仅对你或你的组织可见,则选择 private;如果你希望其他使用 Label Studio API 的用户或应用程序可见(建议),则选择 public

🚀 使用默认配置

默认情况下,Label Studio 在 Spaces 中安装时使用的配置是将应用程序数据库(用于存储配置、账户凭据和项目信息)存储在本地存储中。标注任务和数据项也保存在本地存储中。

Hugging Face Spaces 中的存储是短暂的,默认配置中存储的数据在 Spaces 重启或重置时可能会丢失。因此,我们强烈建议你仅将默认配置用于测试和演示目的。

启动 Label Studio 后,你将看到标准登录屏幕。你可以通过使用电子邮件地址创建新账户并使用新凭据登录来开始。登录后,Label Studio 会定期警告你存储是短暂的,如果你的 Space 重新启动,数据可能会丢失。你还会收到来自 Heidi(Label Studio 有用的吉祥物)的提示,要求你创建一个新项目以开始标注你的数据。要开始使用,请查看 Label Studio 的“从零到一”教程,其中包含有关如何构建情感分析标注界面的指南。

🛠️ 配置生产就绪的 Label Studio 实例

为了使你的 Space 达到生产就绪状态,你需要进行三项配置更改:

  • 禁用无限制的新账户创建。

  • 通过连接外部数据库启用持久性。

  • 为标注任务连接云存储。

禁用无限制的新账户创建

Label Studio 的默认配置允许任何人只要有你的应用程序 URL 就可以无限制地创建新账户。你可以通过在你的 Space 设置中添加以下配置密文来限制注册

  • LABEL_STUDIO_DISABLE_SIGNUP_WITHOUT_LINK:将此值设置为 true 将禁用无限制的账户创建。

  • LABEL_STUDIO_USERNAME:这是你将在 Label Studio Space 中作为第一个用户使用的账户用户名。它应该是一个有效的电子邮件地址。

  • LABEL_STUDIO_PASSWORD:与第一个用户账户关联的密码。

重启 Space 以应用这些设置。从登录屏幕创建新账户的功能将被禁用。要创建新账户,你需要在 Label Studio 应用程序的组织设置中邀请新用户。

启用配置持久性

默认情况下,此 Space 将所有项目配置和数据注释存储在 SQLite 的本地存储中。如果 Space 被重置,Space 中的所有配置和注释数据都将丢失。你可以通过将外部 Postgres 数据库连接到你的 Space 来启用配置持久性,从而确保所有项目和注释设置都得到保留。

设置以下密文变量以匹配你自己的托管 Postgres 实例。我们强烈建议将这些变量设置为密文,以防止你的数据库服务信息在 Space 定义中泄露给公众。

  • DJANGO_DB:将其设置为 default

  • POSTGRE_NAME:将其设置为 Postgres 数据库的名称。

  • POSTGRE_USER:将其设置为 Postgres 用户名。

  • POSTGRE_PASSWORD:将其设置为 Postgres 用户的密码。

  • POSTGRE_HOST:将其设置为你的 Postgres 数据库运行的主机。

  • POSTGRE_PORT:将其设置为你的 Postgres 数据库运行的端口。

  • STORAGE_PERSISTENCE:将其设置为 1 以消除关于短暂存储的警告。

重新启动 Space 以应用这些设置。关于用户、项目和注释的信息将存储在数据库中,如果 Space 重新启动或重置,Label Studio 将重新加载这些信息。

启用云存储

默认情况下,此 Space 仅启用本地数据存储。如果 Space 重置,所有数据都将丢失。要启用永久存储,你必须启用云存储连接器。选择合适的云连接器并为其配置密文。

Amazon S3

  • STORAGE_TYPE:设置为 s3

  • STORAGE_AWS_ACCESS_KEY_ID<你的_ACCESS_KEY_ID>

  • STORAGE_AWS_SECRET_ACCESS_KEY<你的_SECRET_ACCESS_KEY>

  • STORAGE_AWS_BUCKET_NAME<你的_BUCKET_NAME>

  • STORAGE_AWS_REGION_NAME<你的_BUCKET_REGION>

  • STORAGE_AWS_FOLDER:将其设置为空字符串。

Google Cloud Storage

  • STORAGE_TYPE:将其设置为 gcs

  • STORAGE_GCS_BUCKET_NAME<你的_BUCKET_NAME>

  • STORAGE_GCS_PROJECT_ID<你的_PROJECT_ID>

  • STORAGE_GCS_FOLDER:将其设置为空字符串。

  • GOOGLE_APPLICATION_CREDENTIALS:将其设置为 /opt/heartex/secrets/key.json

Azure Blob Storage

  • STORAGE_TYPE:将其设置为 azure

  • STORAGE_AZURE_ACCOUNT_NAME<你的_存储账户>

  • STORAGE_AZURE_ACCOUNT_KEY<你的_存储密钥>

  • STORAGE_AZURE_CONTAINER_NAME<你的_容器名称>

  • STORAGE_AZURE_FOLDER:将其设置为空字符串。

🤗 后续步骤、反馈和支持

要开始使用 Label Studio,请查看 Label Studio 的“从零到一”教程,其中包含一个情感分析标注项目的示例。你可以在Label Studio 主页上找到关于 Label Studio 和 Label Studio 社区的完整资源。这包括完整文档、用于尝试不同标注界面的交互式游乐场以及加入Label Studio Slack 社区的链接。

< > 在 GitHub 上更新

© . This site is unofficial and not affiliated with Hugging Face, Inc.