数据集概述
Hub 上的数据集
Hugging Face Hub 托管着 大量社区整理的数据集,用于各种任务,如翻译、自动语音识别和图像分类。 除了 数据集卡 中包含的信息外,许多数据集,例如 GLUE,还包括一个 数据集查看器 来展示数据。
每个数据集都是一个 Git 存储库,其中包含生成训练、评估和测试拆分的所需数据。 有关数据集存储库结构的信息,请参阅 数据文件配置页面。 遵循支持的存储库结构将确保 Hub 上的数据集页面将具有查看器。
搜索数据集
与模型和空间类似,您可以使用顶部导航栏中的搜索栏或 主数据集页面 搜索 Hub 中的数据集。 您还可以使用大量语言、任务和许可证来过滤您的结果,以找到适合您的数据集。
隐私
由于数据集是存储库,您可以通过“设置”选项卡 在私有和公共之间切换其可见性。 如果数据集由 组织 拥有,则隐私设置适用于该组织的所有成员。
< > 更新 在 GitHub 上