NLP 课程文档

简介

Hugging Face's logo
加入 Hugging Face 社区

并获得增强型文档体验

开始

简介

欢迎来到 Hugging Face 课程!本简介将指导您完成设置工作环境的过程。如果您是课程新手,建议您先查看 第 1 章,然后再回来设置您的环境,以便您亲自尝试代码。

在本课程中,我们将使用的所有库都可作为 Python 包使用,因此我们将向您展示如何设置 Python 环境并安装所需的特定库。

我们将介绍两种设置工作环境的方法,使用 Colab 笔记本或 Python 虚拟环境。您可以随意选择最适合您的方法。对于初学者,我们强烈建议您从使用 Colab 笔记本开始。

请注意,我们不会介绍 Windows 系统。如果您使用的是 Windows,建议您使用 Colab 笔记本进行学习。如果您使用的是 Linux 发行版或 macOS,则可以使用此处介绍的两种方法中的任何一种。

本课程的大部分内容都依赖于您拥有 Hugging Face 帐户。建议您立即创建一个:创建帐户

使用 Google Colab 笔记本

使用 Colab 笔记本是最简单的设置方式;在您的浏览器中启动一个笔记本,直接开始编码!

如果您不熟悉 Colab,建议您先按照 介绍 进行操作。Colab 允许您使用一些加速硬件,例如 GPU 或 TPU,并且对于较小的工作负载而言是免费的。

熟悉 Colab 的操作后,创建一个新的笔记本,并开始设置。

An empty colab notebook

下一步是安装在本课程中将使用的库。我们将使用 pip 进行安装,它是 Python 的包管理器。在笔记本中,您可以通过在系统命令之前添加 ! 字符来运行系统命令,因此您可以按如下方式安装 🤗 Transformers 库:

!pip install transformers

您可以通过在 Python 运行时中导入它来确保该包已正确安装。

import transformers
A gif showing the result of the two commands above: installation and import

这将安装一个非常轻量级的 🤗 Transformers 版本。特别是,没有安装任何特定的机器学习框架(例如 PyTorch 或 TensorFlow)。由于我们将使用该库的许多不同功能,因此建议安装开发版本,该版本包含几乎所有 imaginable 用例所需的所有依赖项。

!pip install transformers[sentencepiece]

这将花费一些时间,但之后您就可以开始使用本课程的其他内容!

使用 Python 虚拟环境

如果您更喜欢使用 Python 虚拟环境,第一步是在您的系统上安装 Python。建议您按照 本指南 开始操作。

安装好 Python 后,您应该能够在终端中运行 Python 命令。您可以首先运行以下命令来确保它已正确安装,然后继续执行后续步骤:python --version。这将打印出您系统上当前可用的 Python 版本。

在终端中运行 Python 命令时,例如 python --version,您应该将运行您的命令的程序视为系统上的“主” Python。建议将此主安装保持为空,并使用它为每个应用程序创建独立的环境——这样,每个应用程序都可以拥有自己的依赖项和包,您无需担心与其他应用程序的潜在兼容性问题。

在 Python 中,这是通过 虚拟环境 完成的,虚拟环境是独立的目录树,每个目录树都包含一个特定 Python 版本的 Python 安装,以及应用程序所需的所有包。您可以使用许多不同的工具创建这样的虚拟环境,但我们将使用官方 Python 包来实现此目的,该包称为 venv

首先,创建您希望应用程序所在的目录——例如,您可能想要在主目录的根目录中创建一个名为 transformers-course 的新目录。

mkdir ~/transformers-course
cd ~/transformers-course

在此目录内,使用 Python venv 模块创建一个虚拟环境。

python -m venv .env

您现在应该在空的文件夹中看到一个名为 .env 的目录。

ls -a
.      ..    .env

您可以使用 activatedeactivate 脚本进入和退出虚拟环境。

# Activate the virtual environment
source .env/bin/activate

# Deactivate the virtual environment
source .env/bin/deactivate

您可以通过运行 which python 命令来确保环境已激活:如果它指向虚拟环境,则说明您已成功激活它!

which python
/home/<user>/transformers-course/.env/bin/python

安装依赖项

与上一节中关于使用 Google Colab 实例的介绍类似,您现在需要安装继续学习所需的包。同样,您可以使用 pip 包管理器安装 🤗 Transformers 的开发版本。

pip install "transformers[sentencepiece]"

现在您已经准备好了,可以开始了!