简介

在第2章中，我们探讨了如何使用分词器和预训练模型进行预测。但是，如果你想微调一个预训练模型来解决特定的任务呢？这正是本章的主题！你将学习到：

📚 重要资源：开始之前，你可能需要查阅🤗 Datasets文档以了解数据处理。

本章还将作为对🤗 Transformers库之外的一些Hugging Face库的介绍！我们将看到像🤗 Datasets、🤗 Tokenizers、🤗 Accelerate和🤗 Evaluate这样的库如何帮助你更高效、更有效地训练模型。

本章的每个主要部分都将教你不同的东西：

在本章结束时，你将能够使用高级API和自定义训练循环在自己的数据集上微调模型，并应用该领域的最新最佳实践。

🎯 你将构建什么：在本章结束时，你将微调一个BERT模型用于文本分类，并了解如何将这些技术应用于你自己的数据集和任务。

本章只专注于PyTorch，因为它已成为现代深度学习研究和生产的标准框架。我们将使用Hugging Face生态系统中的最新API和最佳实践。

要将你训练好的模型上传到Hugging Face Hub，你需要一个Hugging Face账户：创建一个账户

LLM 课程