欢迎来到 Hugging Face 音频课程！

亲爱的学习者，

欢迎来到本课程，学习如何使用 Transformer 进行音频处理。Transformer 一次又一次地证明了自己是最强大和通用的深度学习架构之一，能够在各种任务中取得最先进的成果，包括自然语言处理、计算机视觉，以及最近的音频处理。

在本课程中，我们将探索如何将 Transformer 应用于音频数据。您将学习如何使用它们来处理各种与音频相关的任务。无论您对语音识别、音频分类还是从文本生成语音感兴趣，Transformer 和本课程都能满足您的需求。

为了让您体验这些模型的功能，请在下面的演示中说几句话，观看模型实时转录！

在整个课程中，您将了解处理音频数据的具体细节，学习不同的 Transformer 架构，并利用强大的预训练模型训练您自己的音频 Transformer。

本课程专为具有深度学习背景且对 Transformer 有基本了解的学习者设计。不需要音频数据处理方面的专业知识。如果您需要复习对 Transformer 的理解，请查看我们的自然语言处理课程，其中详细介绍了 Transformer 的基础知识。

认识课程团队

Sanchit Gandhi，Hugging Face 机器学习研究工程师

大家好！我是 Sanchit，我是 Hugging Face 🤗 开源团队的音频机器学习研究工程师。我的主要 focus 是自动语音识别和翻译，当前的目标是使语音模型更快、更轻、更易于使用。

Matthijs Hollemans，Hugging Face 机器学习工程师

我是 Matthijs，我是 Hugging Face 开源团队的音频机器学习工程师。我也是一本关于如何编写声音合成器的书的作者，并且我在业余时间创建音频插件。

Maria Khalusova，Hugging Face 文档和课程

我是 Maria，我创建教育内容和文档，以使 Transformer 和其他开源工具更易于访问。我分解复杂的技术概念，并帮助人们开始使用尖端技术。

Vaibhav Srivastav，Hugging Face 机器学习开发者布道工程师

我是 Vaibhav (VB)，我是 Hugging Face 开源团队的音频开发者布道工程师。我研究低资源文本到语音技术，并帮助将 SoTA 语音研究带给大众。

本课程分为多个单元，深入涵盖各种主题

每个单元都包含一个理论部分，您将在其中深入了解基本概念和技术。在整个课程中，我们提供测验来帮助您测试知识并巩固学习。一些章节还包括实践练习，您将有机会应用所学的知识。

在本课程结束时，您将掌握使用 Transformer 处理音频数据的坚实基础，并能够很好地将这些技术应用于各种与音频相关的任务。

课程单元将分几个连续的模块发布，发布时间表如下

学习本课程没有正确或错误的方式。本课程中的所有材料都是 100% 免费、公开和开源的。您可以按照自己的节奏学习本课程，但是，我们建议您按顺序学习单元。

如果您想在完成课程后获得认证，我们提供两种选择

证书类型	要求
完成证书	根据说明完成 80% 的实践练习。
荣誉证书	根据说明完成 100% 的实践练习。

每个实践练习都概述了其完成标准。一旦您完成了足够的实践练习以获得任一证书的资格，请参阅本课程的最后一个单元，了解如何获得证书。祝你好运！

本课程的单元将在几周内逐步发布。我们鼓励您注册课程更新，这样您就不会错过新单元的发布。注册课程更新的学习者也将是第一批了解我们计划举办的特别社交活动的人。

享受课程！