LLM 课程
加入 Hugging Face 社区
并获得增强的文档体验
章末测验
让我们测试一下你在本章学到的内容!
1. 以下哪些任务可以被定义为词元分类问题?
2. 词元分类的预处理的哪个部分与其他预处理流程不同?
3. 当我们在词元分类问题中对单词进行分词并想要标记词元时,会出现什么问题?
4. “领域自适应”是什么意思?
5. 在掩码语言建模问题中,标签是什么?
6. 以下哪些任务可以被视为序列到序列问题?
7. 序列到序列问题的正确数据预处理方式是什么?
8. 为什么序列到序列问题有一个特定的 Trainer 子类?
10. 什么时候应该预训练一个新模型?
11. 为什么在大量文本上预训练语言模型很容易?
12. 在为问答任务预处理数据时,主要挑战是什么?
13. 问答中的后处理通常是如何完成的?
< > 在 GitHub 上更新