NLP 课程
加入 Hugging Face 社区
并获得增强文档体验
章节末尾测验
让我们测试一下你在本章中学到了什么!
1. 以下哪些任务可以被表述为词性标注问题?
2. 词性标注预处理的哪一部分与其他预处理管道不同?
3. 当我们对词性标注问题中的单词进行分词并希望对标记进行标注时,会出现什么问题?
4. “领域自适应”是什么意思?
5. 掩码语言模型问题中的标签是什么?
6. 这些任务中哪些可以被视为序列到序列问题?
7. 对序列到序列问题的数据进行预处理的正确方法是什么?
8. 为什么针对序列到序列问题存在一个特定的Trainer子类?
10. 什么时候应该预训练一个新的模型?
11. 为什么在大量文本上预训练语言模型很容易?
12. 在对问答任务的数据进行预处理时,主要挑战是什么?
13. 问答中通常如何进行后处理?