显示模型的碳排放量

计算模型碳排放量的好处是什么？

训练机器学习模型通常是能源密集型的，可能会产生大量的碳足迹，正如Strubell 等人所述。因此，**跟踪**和**报告**模型的排放量对于更好地了解我们领域的环境影响至关重要。

关于模型碳足迹，我应该包含哪些信息？

如果可能，您应该包含以下信息：

模型的训练地点
使用的硬件——例如 GPU、TPU 或 CPU，以及数量
训练类型：预训练或微调
模型的估计碳足迹，可以使用 Code Carbon 包实时计算，或者在训练后使用 ML CO2 Calculator 进行计算。

碳足迹元数据

您可以将碳足迹数据添加到模型卡片元数据（在 README.md 文件中）。元数据的结构应为

---
co2_eq_emissions:
  emissions: number (in grams of CO2)
  source: "source of the information, either directly from AutoTrain, code carbon or from a scientific article documenting the model"
  training_type: "pre-training or fine-tuning"
  geographical_location: "as granular as possible, for instance Quebec, Canada or Brooklyn, NY, USA. To check your compute's electricity grid, you can check out https://app.electricitymap.org."
  hardware_used: "how much compute and what kind, e.g. 8 v100 GPUs"
---

我的模型碳足迹是如何计算的？🌎

考虑到计算硬件、位置、使用情况和训练时间，您可以估算模型产生了多少 CO₂。

计算方法相当简单！➕

首先，您需要获取用于训练的电网的*碳强度*——这是每千瓦时电力产生的 CO₂ 量。碳强度取决于硬件的位置和该位置使用的能源组合——无论是太阳能 🌞、风能 🌬️ 和水力 💧 等可再生能源，还是煤炭 ⚫ 和天然气 💨 等不可再生能源。训练中使用的可再生能源越多，碳强度就越低！

然后，您使用 `pynvml` 库获取训练期间 GPU 的功耗。

最后，将功耗和碳强度乘以模型的训练时间，您就得到了 CO₂ 排放量的估算值。

请记住，这并不是一个精确的数字，因为还有其他因素会影响碳排放——例如数据中心供暖和制冷所消耗的能源——这些因素会增加碳排放。但这将使您很好地了解模型产生的 CO₂ 排放量规模！

要将**碳排放**元数据添加到模型中

如果您正在使用 **AutoTrain**，系统会自动为您跟踪 🔥
否则，在您的训练代码中使用 Code Carbon 等跟踪器，然后指定

co2_eq_emissions: 
  emissions: 1.2345

在您的模型卡片元数据中，其中 `1.2345` 是以**克**为单位的排放值。

要了解有关 Transformer 碳足迹的更多信息，请查看 Hugging Face 课程中的视频！

< > 在 GitHub 上更新