NLP 课程
加入 Hugging Face 社区
并获得增强型文档体验
章节末考试
让我们测试一下你在本章中学习了什么!
1. 什么时候应该训练新的分词器?
2. 在使用 train_new_from_iterator() 时,使用文本列表生成器与文本列表列表相比有什么优势?
3. 使用“快速”分词器有哪些优势?
4. 分词分类管道如何处理跨越多个分词的实体?
5. 问答管道如何处理较长的上下文?
6. 什么是规范化?
7. 对于字词分词器,什么是预分词?
8. 选择适用于 BPE 分词模型的句子。
9. 选择适用于 WordPiece 分词模型的句子。
10. 选择适用于 Unigram 分词模型的句子。