LLM 课程文档
Argilla 简介
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
Argilla 简介
在第 5 章中,您学习了如何使用 🤗 Datasets 库构建数据集;在第 6 章中,您探索了如何针对一些常见的 NLP 任务微调模型。在本章中,您将学习如何使用 Argilla 来标注和策划数据集,这些数据集可用于训练和评估您的模型。
训练性能良好的模型的关键在于拥有高质量的数据。尽管 Hub 中有一些不错的数据集可用于训练和评估模型,但这些数据集可能与您的特定应用程序或用例无关。在这种情况下,您可能需要构建和策划自己的数据集。Argilla 将帮助您高效地完成这项工作。

使用 Argilla,您可以
- 将非结构化数据转换为结构化数据,用于 NLP 任务。
- 策划数据集,从低质量数据集转变为高质量数据集。
- 收集 LLM 和多模态模型的人工反馈。
- 邀请专家与您在 Argilla 中协作,或众包标注!
以下是您将在本章中学习的一些内容
- 如何设置您自己的 Argilla 实例。
- 如何加载数据集并根据一些流行的 NLP 任务对其进行配置。
- 如何使用 Argilla UI 标注您的数据集。
- 如何使用您策划的数据集并将其导出到 Hub。