第四单元. 构建音乐流派分类器

你将学到什么以及构建什么

音频分类是 transformers 在音频和语音处理中最常见的应用之一。与机器学习中的其他分类任务一样，此任务涉及根据音频记录的内容为其分配一个或多个标签。例如，在语音的情况下，我们可能想要检测何时说出“Hey Siri”之类的唤醒词，或者从诸如“今天天气怎么样？”之类的口语查询中推断出诸如“温度”之类的关键词。环境声音提供了另一个例子，我们可能想要自动区分诸如“汽车喇叭”、“警报器”、“狗叫”等声音。

在本节中，我们将了解如何将预训练的音频 transformers 应用于各种音频分类任务。然后，我们将微调一个 transformer 模型，用于音乐分类任务，将歌曲分类为“流行”和“摇滚”等流派。这是像 Spotify 这样的音乐流媒体平台的重要组成部分，这些平台会推荐与用户正在收听的歌曲相似的歌曲。

在本节结束时，你将知道如何：

查找适用于音频分类任务的合适的预训练模型
使用 🤗 Datasets 库和 Hugging Face Hub 选择音频分类数据集
微调预训练模型以按流派对歌曲进行分类
构建一个 Gradio 演示，让你能够对自己的歌曲进行分类

< > 在 GitHub 上更新

音频课程

第四单元. 构建音乐流派分类器

你将学到什么以及构建什么