Datasets 文档

数据集

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

数据集

🤗 Datasets 是一个用于轻松访问和共享音频、计算机视觉和自然语言处理 (NLP) 任务的 AI 数据集的库。

只需一行代码即可加载数据集,并使用我们强大的数据处理和流式处理方法,快速准备好数据集以供深度学习模型进行训练。基于 Apache Arrow 格式,通过零拷贝读取处理大型数据集,没有任何内存限制,从而实现最佳的速度和效率。我们还与 Hugging Face Hub 进行了深度集成,使您能够轻松地与更广泛的机器学习社区加载和共享数据集。

立即在 Hugging Face Hub 上查找您的数据集,并使用实时查看器深入了解它。

在 GitHub 上更新

© . This site is unofficial and not affiliated with Hugging Face, Inc.