在 Hub 上推出存储区域
发布日期:2023年11月3日
在 GitHub 上更新作为我们 企业版 Hub 计划的一部分,我们最近发布了对 存储区域 的支持。
区域允许您决定组织的模型和数据集的存储位置。这主要有两个好处,我们将在本博客文章中简要介绍:
- 法规和法律合规性,以及更普遍的,更好的数字主权
- 性能(提高下载和上传速度以及降低延迟)
目前我们支持以下区域:
- 美国 🇺🇸
- 欧盟 🇪🇺
- 即将推出:亚太地区 🌏
但首先,让我们看看如何在您的组织设置中设置此功能 🔥
组织设置
如果您的组织尚未成为企业版 Hub 组织,您将看到以下屏幕:
订阅后,您将能够看到“区域”设置页面。
在该页面上,您可以看到:
- 您的组织仓库当前所在位置的审计信息
- 用于选择创建仓库位置的下拉菜单
仓库标签
存储在非默认位置的任何仓库(模型或数据集)都将直接显示其区域作为标签。这样,您的组织成员可以一目了然地看到仓库的位置。
法规和法律合规性
在许多受监管的行业中,您可能需要将数据存储在特定区域。
对于欧盟的公司而言,这意味着您可以使用 Hub 以符合 GDPR 的方式构建机器学习:数据集、模型和推理端点都存储在欧盟数据中心内。
如果您是企业版 Hub 客户并对此有进一步疑问,请联系我们!
性能
将模型或数据集存储在离您的团队和基础设施更近的位置,也意味着显著提高上传和下载的性能。
考虑到模型权重和数据集文件通常非常大,这会带来巨大的差异。
举例来说,如果您位于欧洲并将仓库存储在欧盟区域,您可以预期上传和下载速度比存储在美国快约 4-5 倍。