Datasets 文档

数据集

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

数据集

🤗 Datasets 是一个库,可以轻松访问和分享用于音频、计算机视觉和自然语言处理 (NLP) 任务的数据集。

只需一行代码即可加载数据集,并使用我们强大的数据处理方法快速准备你的数据集,以便在深度学习模型中进行训练。在 Apache Arrow 格式的支持下,以零拷贝读取方式处理大型数据集,不受任何内存限制,从而实现最佳速度和效率。我们还与 Hugging Face Hub 深度集成,使你可以轻松地加载数据集并与更广泛的机器学习社区分享。

今天就在 Hugging Face Hub 上找到你的数据集,并通过实时查看器深入了解其内部。

< > 更新 在 GitHub 上