章节末尾测验
1. 语言建模管道的顺序是什么?
2. 基本 Transformer 模型输出的张量有多少个维度,它们分别是什么?
3. 以下哪个是子词分词的示例?
4. 什么是模型头?
5. 什么是 AutoModel?
6. 当将不同长度的序列一起批处理时,需要注意哪些技术?
7. 将 SoftMax 函数应用于序列分类模型输出的 logits 的目的是什么?
8. 分词器 API 主要围绕哪种方法?
9. 在此代码示例中,result 变量包含什么?
from transformers import AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
result = tokenizer.tokenize("Hello!")
10. 以下代码是否有问题?
from transformers import AutoTokenizer, AutoModel
tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
model = AutoModel.from_pretrained("gpt2")
encoded = tokenizer("Hey!", return_tensors="pt")
result = model(**encoded)