音频课程文档

动手练习

Hugging Face's logo
加入 Hugging Face 社区

并获得增强文档体验

开始

动手练习

此练习不计分,旨在帮助您熟悉在课程剩余部分中将使用的工具和库。如果您已经熟悉使用 Google Colab、🤗 数据集、librosa 和 🤗 Transformers,您可以选择跳过此练习。

  1. 创建一个 Google Colab 笔记本。
  2. 使用 🤗 数据集以流模式加载您选择的语言的 facebook/voxpopuli 数据集 的训练拆分。
  3. 获取数据集 train 部分中的第三个示例并进行探索。鉴于此示例具有的特征,您可以使用此数据集进行哪些类型的音频任务?
  4. 绘制此示例的波形和频谱图。
  5. 转到 🤗 Hub,探索预训练模型并找到一个可用于您之前选择的语言的自动语音识别的模型。使用您找到的模型实例化相应的管道,并转录示例。
  6. 比较从管道获得的转录与示例中提供的转录。

如果您难以完成此练习,请随时查看 示例解决方案。发现有趣的东西了吗?找到一个酷炫的模型了吗?获得了一个漂亮的频谱图吗?请随时在 Twitter 上分享您的工作和发现!

在接下来的章节中,您将了解有关各种音频 Transformer 架构的更多信息,并将训练您自己的模型!