音频课程文档
欢迎来到 Hugging Face 音频课程!
并获取增强的文档体验
开始
欢迎来到 Hugging Face 音频课程!
亲爱的学习者,
欢迎来到本课程,学习如何使用 Transformer 进行音频处理。Transformer 一次又一次地证明了自己是最强大和通用的深度学习架构之一,能够在各种任务中取得最先进的成果,包括自然语言处理、计算机视觉,以及最近的音频处理。
在本课程中,我们将探索如何将 Transformer 应用于音频数据。您将学习如何使用它们来处理各种与音频相关的任务。无论您对语音识别、音频分类还是从文本生成语音感兴趣,Transformer 和本课程都能满足您的需求。
为了让您体验这些模型的功能,请在下面的演示中说几句话,观看模型实时转录!
在整个课程中,您将了解处理音频数据的具体细节,学习不同的 Transformer 架构,并利用强大的预训练模型训练您自己的音频 Transformer。
本课程专为具有深度学习背景且对 Transformer 有基本了解的学习者设计。不需要音频数据处理方面的专业知识。如果您需要复习对 Transformer 的理解,请查看我们的自然语言处理课程,其中详细介绍了 Transformer 的基础知识。
认识课程团队
Sanchit Gandhi,Hugging Face 机器学习研究工程师
大家好!我是 Sanchit,我是 Hugging Face 🤗 开源团队的音频机器学习研究工程师。我的主要 focus 是自动语音识别和翻译,当前的目标是使语音模型更快、更轻、更易于使用。
Matthijs Hollemans,Hugging Face 机器学习工程师
我是 Matthijs,我是 Hugging Face 开源团队的音频机器学习工程师。我也是一本关于如何编写声音合成器的书的作者,并且我在业余时间创建音频插件。
Maria Khalusova,Hugging Face 文档和课程
我是 Maria,我创建教育内容和文档,以使 Transformer 和其他开源工具更易于访问。我分解复杂的技术概念,并帮助人们开始使用尖端技术。
Vaibhav Srivastav,Hugging Face 机器学习开发者布道工程师
我是 Vaibhav (VB),我是 Hugging Face 开源团队的音频开发者布道工程师。我研究低资源文本到语音技术,并帮助将 SoTA 语音研究带给大众。
课程结构
本课程分为多个单元,深入涵盖各种主题
- 单元 1:了解处理音频数据的具体细节,包括音频处理技术和数据准备。
- 单元 2:了解音频应用,学习如何使用 🤗 Transformers pipelines 处理不同的任务,例如音频分类和语音识别。
- 单元 3:探索音频 Transformer 架构,了解它们之间的区别以及最适合的任务。
- 单元 4:学习如何构建自己的音乐流派分类器。
- 单元 5:深入研究语音识别,并构建一个模型来转录会议录音。
- 单元 6:学习如何从文本生成语音。
- 单元 7:学习如何使用 Transformer 构建实际的音频应用程序。
每个单元都包含一个理论部分,您将在其中深入了解基本概念和技术。在整个课程中,我们提供测验来帮助您测试知识并巩固学习。一些章节还包括实践练习,您将有机会应用所学的知识。
在本课程结束时,您将掌握使用 Transformer 处理音频数据的坚实基础,并能够很好地将这些技术应用于各种与音频相关的任务。
课程单元将分几个连续的模块发布,发布时间表如下
单元 | 发布日期 |
---|---|
单元 0、单元 1 和单元 2 | 2023 年 6 月 14 日 |
单元 3、单元 4 | 2023 年 6 月 21 日 |
单元 5 | 2023 年 6 月 28 日 |
单元 6 | 2023 年 7 月 5 日 |
单元 7、单元 8 | 2023 年 7 月 12 日 |
学习路径和认证
学习本课程没有正确或错误的方式。本课程中的所有材料都是 100% 免费、公开和开源的。您可以按照自己的节奏学习本课程,但是,我们建议您按顺序学习单元。
如果您想在完成课程后获得认证,我们提供两种选择
证书类型 | 要求 |
---|---|
完成证书 | 根据说明完成 80% 的实践练习。 |
荣誉证书 | 根据说明完成 100% 的实践练习。 |
每个实践练习都概述了其完成标准。一旦您完成了足够的实践练习以获得任一证书的资格,请参阅本课程的最后一个单元,了解如何获得证书。祝你好运!
注册课程
本课程的单元将在几周内逐步发布。我们鼓励您注册课程更新,这样您就不会错过新单元的发布。注册课程更新的学习者也将是第一批了解我们计划举办的特别社交活动的人。
享受课程!
< > 在 GitHub 上更新