元数据解析

鉴于格式的简洁性，使用小的 (Range) HTTP 请求来获取和解析关于 Safetensors 权重的元数据（即张量列表、它们的类型以及它们的形状或参数数量）非常简单高效。

此解析已在 huggingface.js 的 JS 中实现（示例如下），但在任何语言中都类似。

示例用例

可能有很多潜在的用例。例如，我们在 HuggingFace Hub 上使用它来显示有关具有 safetensors 权重的模型的信息

http

javascript

python

例如，以下是 HuggingFace Hub 上一些模型的每种 dtype 的参数数量。另请参阅此问题以获取更多用法示例。

模型	safetensors	参数
gpt2	单文件	{ ‘F32’ => 137022720 }
roberta-base	单文件	{ ‘F32’ => 124697433, ‘I64’ => 514 }
Jean-Baptiste/camembert-ner	单文件	{ ‘F32’ => 110035205, ‘I64’ => 514 }
roberta-large	单文件	{ ‘F32’ => 355412057, ‘I64’ => 514 }
distilbert-base-german-cased	单文件	{ ‘F32’ => 67431550 }
EleutherAI/gpt-neox-20b	分片	{ ‘F16’ => 20554568208, ‘U8’ => 184549376 }
bigscience/bloom-560m	单文件	{ ‘F16’ => 559214592 }
bigscience/bloom	分片	{ ‘BF16’ => 176247271424 }
bigscience/bloom-3b	单文件	{ ‘F16’ => 3002557440 }