Hub 文档
配置数据集查看器
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
配置数据集查看器
数据集查看器支持多种数据文件格式,从文本到表格,从图像到音频格式。它还根据文件和文件夹名称分隔训练/验证/测试拆分。
要为你的数据集配置数据集查看器,首先请确保你的数据集是受支持的数据格式。
配置拆分或子集的下拉菜单
在数据集查看器中,你可以查看数据集的训练/验证/测试拆分,有时还可以选择多个子集(例如,每种语言一个子集)。
要定义这些下拉菜单,你可以根据拆分名称(train/validation/test)命名数据文件或其文件夹。也可以使用 YAML 手动自定义拆分。
有关更多信息,请随时查看关于数据文件配置和示例数据集集合的文档。图像数据集文档页面提出了使用图像构建数据集的各种方法。
禁用查看器
数据集查看器可以被禁用。要执行此操作,请将 YAML 部分添加到数据集的 README.md
文件(如果尚不存在,则创建一个),并添加值为 false
的 viewer
属性。
---
viewer: false
---
私有数据集
对于私有数据集,数据集查看器对 PRO 用户 和 企业版 Hub 组织 启用。
< > 在 GitHub 上更新