数据集下载统计
数据集下载统计是如何生成的?
Hub 为所有可通过 datasets
库加载的数据集提供下载统计数据。为了确定下载次数,Hub 会统计每次在 Python 中调用 load_dataset
的次数,但不包括 GitHub 上 Hugging Face 的 CI 工具。不会从用户那里发送任何信息,也不会为此进行其他调用。计数是在服务器端完成的,因为我们在提供文件进行下载。这意味着
- 无论数据是直接存储在 Hub 仓库中,还是仓库具有一个 脚本 用于从外部来源加载数据,下载次数都是相同的。
- 如果用户使用
wget
或 Hub 的用户界面 (UI) 等工具手动下载数据,则这些下载将不计入下载次数。