NLP 课程文档

章节末尾测验

Hugging Face's logo
加入 Hugging Face 社区

并获得增强文档体验的访问权限

开始

章节末尾测验

Ask a Question

本章涵盖了很多内容!如果您没有掌握所有细节,请不要担心;接下来的章节将帮助您了解幕后事物的工作原理。

不过,在继续之前,让我们测试一下您在本节中学到了什么。

1. 🤗 Datasets 中的 load_dataset() 函数允许您从以下哪些位置加载数据集?

2. 假设您如下加载 GLUE 任务之一:

from datasets import load_dataset

dataset = load_dataset("glue", "mrpc", split="train")

以下哪个命令将从 dataset 中生成 50 个元素的随机样本?

3. 假设您有一个关于家庭宠物的数据集,称为 pets_dataset,其中有一列 name 用于表示每只宠物的名称。以下哪种方法可以过滤数据集,以便仅包含名称以字母“L”开头的所有宠物?

4. 什么是内存映射?

5. 内存映射的主要好处有哪些?

6. 以下代码为什么失败?

from datasets import load_dataset

dataset = load_dataset("allocine", streaming=True, split="train")
dataset[0]

7. 创建数据集卡片的主要好处有哪些?

8. 什么是语义搜索?

9. 对于非对称语义搜索,你通常会有:

10. 我可以利用 🤗 Datasets 加载数据并在其他领域(如语音处理)中使用吗?