LLM 课程文档

结论

LLM 课程

0. 设置

1. Transformer 模型

2. 使用 🤗 Transformers

3. 微调预训练模型

4. 共享模型和分词器

5. 🤗 Datasets 库

6. 🤗 Tokenizers 库

7. 经典 NLP 任务

8. 如何寻求帮助

9. 构建和分享演示

10. 策划高质量数据集

11. 微调大型语言模型

导言聊天模板使用 SFTTrainer 进行微调 LoRA (低秩自适应) 评估结论考试时间！

12. 构建推理模型新

课程活动

加入 Hugging Face 社区

并获得增强的文档体验

协作处理模型、数据集和 Spaces

通过加速推理获得更快的示例

切换文档主题

开始使用

结论

在本章中，我们探讨了微调语言模型的必要组成部分

聊天模板 为模型交互提供结构，通过标准化的格式确保一致且适当的响应。
监督微调 (SFT) 允许预训练模型适应特定任务，同时保持其基础知识。
LoRA 提供了一种高效的微调方法，通过减少可训练参数，同时保持模型性能。
评估通过各种指标和基准，帮助衡量和验证微调的有效性。

这些技术结合使用，可以创建专门的语言模型，使其在特定任务中表现出色，同时保持计算效率。无论您是构建客户服务机器人还是特定领域的助手，理解这些概念对于成功的模型调整至关重要。

< > 在 GitHub 上更新

←评估考试时间！→