Inference Endpoints (专用) 文档

使用 AWS PrivateLink 创建私有终端节点

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始

使用 AWS PrivateLink 创建私有终端节点

安全和安全的推理是 Inference Endpoints 的关键原则。我们目前提供三个不同的安全级别:公共、受保护和私有

公共和受保护的终端节点不需要任何额外的配置。但是,为了为安全的区域内连接创建私有终端节点,您需要提供也应该有权访问 Inference Endpoints 的 AWS 账户 ID。

1. 选择私有终端节点安全级别

选择“私有”选项以确保终端节点仅通过区域内安全 AWS PrivateLink 连接可用。输入您的 AWS 账户 ID 并启用 PrivateLink 共享(如果您希望 PrivateLink 在多个终端节点之间共享)。这会将 1 个或多个终端节点连接到同一 VPC 终端节点。

select private link

2. 创建终端节点

在提供您的 AWS 账户 ID 和任何其他必需信息后,单击“创建终端节点”。终端节点创建过程将开始。

creation process

几分钟后,终端节点将创建完成,您将在概述中看到 VPC 服务名称。此名称对于在您的 AWS 账户中创建 VPC 接口终端节点是必需的。

vpc service name

3. 配置 VPC 接口终端节点

转到您的 AWS 控制台 并导航到 VPC 部分以创建 VPC 接口终端节点。选择“其他终端节点服务”,然后输入之前提供的 VPC 服务名称。

add private link

验证服务名称以确保连接正确。选择您希望用于此终端节点的 VPC 和子网。确保它们符合您的安全要求。

vpc endpoint

4. 终端节点正在运行

在 VPC 终端节点状态从“待处理”更改为“可用”后,您应该在概述中看到一个终端节点 URL。此 URL 现在可以在您的 VPC 内部使用,以安全可靠的方式访问您的终端节点,从而确保流量仅在两个终端节点之间发生,并且永远不会离开 AWS。

endpoint running

共享私有服务

如果您已启用 PrivateLink 共享选项,则现在可以创建共享同一 VPC 终端节点的其他终端节点。这允许您将多个终端节点连接到同一 VPC 终端节点。

shared private link < > 在 GitHub 上更新