为数据集和模型引入 DOI (数字对象标识符)
Hugging Face 的使命是普及优秀的机器学习。这包括推广最佳实践,使机器学习模型和数据集更具可复现性、文档更完善、更易于使用和共享。
为了应对这一挑战,我们激动地宣布,您现在可以直接从 Hub 为您的模型或数据集生成 DOI!
您可以直接从代码仓库的设置中生成 DOI,之后任何人都可以通过点击您模型或数据集页面上的“引用此模型/数据集”来引用您的工作 🔥。

DOI 简介及其重要性
DOI (数字对象标识符) 是唯一标识数字对象的字符串,涵盖从文章到图表,也包括数据集和模型。DOI 与对象的元数据绑定,包括对象的 URL、版本、创建日期、描述等。它们是科研和学术界广泛接受的数字资源引用标准,类似于书籍的 ISBN。
DOI 使查找模型或数据集的信息变得更加容易,并通过一个永不过期或更改的永久链接与世界分享。因此,带有 DOI 的数据集/模型旨在永久保存,只有在向我们的支持团队提交请求后才可能被删除。
Hugging Face 如何分配 DOI?
我们与 DataCite 合作,允许 Hub 的注册用户为其模型或数据集申请 DOI。一旦他们填写完必要的元数据,就能获得一个崭新的 DOI 🌟!

如果模型或数据集有新版本,DOI 可以轻松更新,而旧版本的 DOI 则会被标记为过时。这使得引用对象的特定版本变得很容易,即使它已经发生了变化。
对我们还有什么改进建议吗?许多功能,就像这个一样,都直接来自社区的反馈。请给我们留言或在 Twitter 上 @HuggingFace 分享您的想法,或者在 huggingface/hub-docs 上提一个 issue 🤗
感谢 DataCite 团队的这次合作!同时感谢 Alix Leroy、Bram Vanroy、Daniel van Strien 和 Yoshitomo Matsubara 在 这个 hub-docs
GitHub issue 中发起并推动了讨论。