LLM 课程文档
章节末测验
加入 Hugging Face 社区
并获得增强的文档体验
开始
章节末测验
本章涵盖了很多内容!如果您没有掌握所有细节,请不要担心;接下来的章节将帮助您了解事情是如何在底层运作的。
不过,在继续之前,让我们测试一下您在本章中学到的内容。
1. 🤗 Datasets 中的 load_dataset() 函数允许您从以下哪些位置加载数据集?
2. 假设您按如下方式加载 GLUE 任务之一:
from datasets import load_dataset
dataset = load_dataset("glue", "mrpc", split="train")
以下哪个命令将从 dataset
中生成 50 个元素的随机样本?
3. 假设您有一个关于家养宠物的名为 pets_dataset
的数据集,其中有一个 name
列表示每个宠物的名称。以下哪种方法可以让您过滤数据集,以获取所有名称以字母 “L” 开头的宠物?
4. 什么是内存映射?
5. 以下哪些是内存映射的主要优点?
6. 为什么以下代码会失败?
from datasets import load_dataset
dataset = load_dataset("allocine", streaming=True, split="train")
dataset[0]