AWS Trainium & Inferentia 文档

用于 AWS inferentia2 的 NeuronX 文本生成推理

AWS Trainium 和 Inferentia

加入 Hugging Face 社区

并获得增强的文档体验

在模型、数据集和 Spaces 上进行协作

通过加速推理获得更快的示例

切换文档主题

开始使用

用于 AWS inferentia2 的 NeuronX 文本生成推理

文本生成推理（TGI）是用于部署和提供大型语言模型（LLMs）服务的工具包。

neuron 后端允许为 Trainium 和 Inferentia 芯片部署 TGI。

←使用 AWS Neuron 的推理流水线使用 vLLM 在 Neuron 平台上进行推理→

© . This site is unofficial and not affiliated with Hugging Face, Inc.