NLP 课程
加入 Hugging Face 社区
并获取增强文档体验
章节末测试
让我们测试一下你在本章中所学到的知识!
1. 为什么要训练新的分词器?
2. 使用文本列表生成器与使用文本列表列表相比,在使用 train_new_from_iterator() 时有什么优势?
3. 使用“快速”分词器有什么优势?
4. 标记分类管道如何处理跨越多个标记的实体?
5. 问答管道如何处理长上下文?
6. 什么是规范化?
7. 子词分词器的前分词是什么?
8. 选择适用于 BPE 分词模型的句子。
9. 选择适用于 WordPiece 分词模型的句子。
10. 选择适用于 Unigram 分词模型的句子。