章节末尾测验
1. 语言建模管道的顺序是什么?
2. 基础 Transformer 模型输出的张量有多少维度,它们是什么?
3. 以下哪一项是子词分词的例子?
4. 什么是模型头?
5. 什么是 AutoModel?
6. 当将不同长度的序列一起批处理时,需要注意哪些技术?
7. 将 SoftMax 函数应用于序列分类模型输出的 logits 的目的是什么?
8. 分词器 API 大部分围绕着哪个方法?
9. 在这个代码示例中,result 变量包含什么?
from transformers import AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
result = tokenizer.tokenize("Hello!")
10. 以下代码有什么问题吗?
from transformers import AutoTokenizer, AutoModel
tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
model = AutoModel.from_pretrained("gpt2")
encoded = tokenizer("Hey!", return_tensors="pt")
result = model(**encoded)