LLM 课程文档

章节末测验

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

章节末测验

Ask a Question

本章涵盖了许多内容!不用担心你没有掌握所有细节;接下来的章节将帮助你理解其内部工作原理。

不过,在继续之前,让我们测试一下你本章学到的内容。

1. 🤗 Datasets 中的 `load_dataset()` 函数允许您从以下哪个位置加载数据集?

2. 假设您按如下方式加载了一个 GLUE 任务:

from datasets import load_dataset

dataset = load_dataset("glue", "mrpc", split="train")

以下哪个命令将从 `dataset` 中生成 50 个随机元素?

3. 假设您有一个名为 `pets_dataset` 的家庭宠物数据集,其中有一个 `name` 列表示每只宠物的名字。以下哪种方法可以过滤数据集,以获取所有名字以字母“L”开头的宠物?

4. 什么是内存映射?

5. 以下哪些是内存映射的主要优点?

6. 为什么以下代码会失败?

from datasets import load_dataset

dataset = load_dataset("allocine", streaming=True, split="train")
dataset[0]

7. 创建数据集卡片的主要好处是什么?

8. 什么是语义搜索?

9. 对于非对称语义搜索,通常有:

10. 我可以使用 🤗 Datasets 来加载用于其他领域(例如语音处理)的数据吗?

< > 在 GitHub 上更新