NLP 课程文档

🤗 数据集,搞定!

Hugging Face's logo
加入 Hugging Face 社区

并获得增强文档体验

开始使用

🤗 数据集,搞定!

Ask a Question

好吧,这确实是对 🤗 Datasets 库的一次全面巡视——恭喜您坚持到目前为止!通过您在本节中学到的知识,您应该能够

  • 从任何地方加载数据集,无论是 Hugging Face Hub、您的笔记本电脑还是公司中的远程服务器。
  • 使用 Dataset.map()Dataset.filter() 函数的组合来整理您的数据。
  • 使用 Dataset.set_format() 在 Pandas 和 NumPy 等数据格式之间快速切换。
  • 创建您自己的数据集并将其推送到 Hugging Face Hub。
  • 使用 Transformer 模型嵌入您的文档,并使用 FAISS 构建语义搜索引擎。

第 7 章 中,我们将充分利用所有这些内容,深入探讨 Transformer 模型擅长的核心 NLP 任务。不过,在继续之前,请先参加一个简短的测验,检验一下您对 🤗 Datasets 的掌握程度!