Jupyter X Hugging Face

发布于 2023 年 3 月 23 日
在 GitHub 上更新

我们很高兴地宣布,Jupyter Notebook 在 Hugging Face Hub 上的支持得到了改进!

从作为重要的学习资源到作为模型开发的关键工具,Jupyter Notebook 已成为机器学习许多领域的关键组成部分。Notebook 的交互性和可视化特性使您在开发模型、数据集和演示时能够快速获得反馈。对于许多人来说,他们第一次接触机器学习模型训练是通过 Jupyter Notebook,许多从业者将 Notebook 作为开发和交流其工作的关键工具。

Hugging Face 是一个协作式机器学习平台,社区已在其中分享了超过 150,000 个模型、25,000 个数据集和 30,000 个机器学习应用程序。Hub 拥有模型和数据集版本控制工具,包括模型卡和客户端库以自动化版本控制过程。然而,仅仅包含带有超参数的模型卡不足以提供最佳的可复现性;这就是 Notebook 可以提供帮助的地方。除了这些模型、数据集和演示,Hub 还托管了 7,000 多个 Notebook。这些 Notebook 通常记录了模型或数据集的开发过程,并可以提供指导和教程,展示其他人如何使用这些资源。因此,我们很高兴看到 Hub 对 Notebook 托管的支持得到了改进。

我们改变了什么?

在底层,Jupyter Notebook 文件(通常以 ipynb 扩展名共享)是 JSON 文件。虽然可以直接查看这些文件,但这不是一种供人类阅读的格式。我们现在已添加了对 Hub 上托管的 Notebook 的渲染支持。这意味着 Notebook 现在将以人类可读的格式显示。

A side-by-side comparison showing a screenshot of a notebook that hasn’t been rendered on the left and a rendered version on the right.  The non-rendered image shows part of a JSON file containing notebook cells that are difficult to read. The rendered version shows a notebook hosted on the Hugging Face hub showing the notebook rendered in a human-readable format. The screenshot shows some of the context of the Hugging Face Hub hosting, such as the branch and a window showing the rendered notebook. The rendered notebook has some example Markdown and code snippets showing the notebook output.
在 Hub 上托管的 Notebook 渲染前后对比。

为什么我们很高兴能在 Hub 上托管更多 Notebook?

  • Notebook 有助于记录人们如何使用您的模型和数据集;在与您的模型和数据集相同的位置共享 Notebook,使其他人更容易使用您在 Hub 上创建和共享的资源。
  • 许多人使用 Hub 来开发机器学习作品集。您现在也可以使用 Jupyter Notebook 补充此作品集。
  • 支持在 Google Colab 中一键直接打开 Hub 上托管的 Notebook,使 Hub 上的 Notebook 体验更加强大。敬请期待未来的公告!

社区

注册登录以评论