LLM 课程文档

Argilla 简介

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

Argilla 简介

Ask a Question

在第 5 章中,您学习了如何使用 🤗 Datasets 库构建数据集;在第 6 章中,您探索了如何针对一些常见的 NLP 任务微调模型。在本章中,您将学习如何使用 Argilla标注和策划数据集,这些数据集可用于训练和评估您的模型。

训练性能良好的模型的关键在于拥有高质量的数据。尽管 Hub 中有一些不错的数据集可用于训练和评估模型,但这些数据集可能与您的特定应用程序或用例无关。在这种情况下,您可能需要构建和策划自己的数据集。Argilla 将帮助您高效地完成这项工作。

Argilla sign in page.

使用 Argilla,您可以

  • 将非结构化数据转换为结构化数据,用于 NLP 任务。
  • 策划数据集,从低质量数据集转变为高质量数据集
  • 收集 LLM 和多模态模型的人工反馈
  • 邀请专家与您在 Argilla 中协作,或众包标注!

以下是您将在本章中学习的一些内容

  • 如何设置您自己的 Argilla 实例。
  • 如何加载数据集并根据一些流行的 NLP 任务对其进行配置。
  • 如何使用 Argilla UI 标注您的数据集。
  • 如何使用您策划的数据集并将其导出到 Hub。
< > 在 GitHub 上更新