Datasets 文档
数据集
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
Datasets

🤗 Datasets 是一个能轻松访问和共享 AI 数据集的库,可用于音频、计算机视觉和自然语言处理 (NLP) 任务。
只需一行代码即可加载数据集,并使用我们强大的数据处理和流式传输方法,快速准备好用于深度学习模型训练的数据集。该库由 Apache Arrow 格式支持,可以零拷贝读取大型数据集,不受任何内存限制,从而实现最佳的速度和效率。我们还与 Hugging Face Hub 深度集成,让你可以轻松加载数据集并与更广泛的机器学习社区共享。
立即在 Hugging Face Hub 上找到你的数据集,并使用实时查看器深入了解它。
< > 在 GitHub 上更新