LLM 课程文档
Argilla 简介
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
Argilla 简介
在第 5 章中,你学习了如何使用 🤗 Datasets 库构建数据集,在第 6 章中,你探索了如何针对一些常见 NLP 任务微调模型。在本章中,你将学习如何使用 Argilla 来标注和整理数据集,以便用于训练和评估你的模型。
训练性能良好的模型的关键是拥有高质量的数据。尽管 Hub 中有一些不错的数据集可以用于训练和评估你的模型,但这些数据集可能与你的特定应用或用例不相关。在这种情况下,你可能需要构建和整理自己的数据集。Argilla 将帮助你高效地完成这项工作。

通过 Argilla,你可以:
- 将非结构化数据转化为用于 NLP 任务的结构化数据。
- 整理数据集,从低质量数据集转变为高质量数据集。
- 收集 LLM 和多模态模型的人工反馈。
- 邀请专家与你协作进行 Argilla 标注,或众包标注!
以下是你在本章中将学到的一些内容:
- 如何设置自己的 Argilla 实例。
- 如何加载数据集并根据一些流行的 NLP 任务进行配置。
- 如何使用 Argilla UI 标注你的数据集。
- 如何使用你整理的数据集并将其导出到 Hub。