数据集
加入 Hugging Face 社区
并获得增强的文档体验
概述
操作指南提供了 🤗 Datasets 所有工具的更全面概述以及如何使用它们。这将帮助您处理更杂乱的真实世界数据集,您可能需要修改数据集的结构或内容,以便为训练做好准备。
指南假定您已经熟悉并掌握了 🤗 Datasets 的基础知识。我们建议新用户先查看我们的教程。
有兴趣了解更多信息吗?请查看 Hugging Face 课程的第 5 章!
这些指南分为六个部分
- 通用用法:用于通用数据集加载和处理的函数。本节所示的函数适用于所有数据集模式。
- 音频:如何加载、处理和共享音频数据集。
- 视觉:如何加载、处理和共享图像和视频数据集。
- 文本:如何加载、处理和共享文本数据集。
- 表格:如何加载、处理和共享表格数据集。
- 数据集仓库:如何将数据集分享和上传到Hub。
如果您对 🤗 Datasets 有任何疑问,欢迎加入我们的论坛提问。
在 GitHub 上更新
© . This site is unofficial and not affiliated with Hugging Face, Inc.