音频课程文档

第四单元. 构建音乐流派分类器

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

第四单元. 构建音乐流派分类器

你将学到什么以及构建什么

音频分类是 transformers 在音频和语音处理中最常见的应用之一。与机器学习中的其他分类任务一样,此任务涉及根据音频记录的内容为其分配一个或多个标签。例如,在语音的情况下,我们可能想要检测何时说出“Hey Siri”之类的唤醒词,或者从诸如“今天天气怎么样?”之类的口语查询中推断出诸如“温度”之类的关键词。环境声音提供了另一个例子,我们可能想要自动区分诸如“汽车喇叭”、“警报器”、“狗叫”等声音。

在本节中,我们将了解如何将预训练的音频 transformers 应用于各种音频分类任务。然后,我们将微调一个 transformer 模型,用于音乐分类任务,将歌曲分类为“流行”和“摇滚”等流派。这是像 Spotify 这样的音乐流媒体平台的重要组成部分,这些平台会推荐与用户正在收听的歌曲相似的歌曲。

在本节结束时,你将知道如何:

  • 查找适用于音频分类任务的合适的预训练模型
  • 使用 🤗 Datasets 库和 Hugging Face Hub 选择音频分类数据集
  • 微调预训练模型以按流派对歌曲进行分类
  • 构建一个 Gradio 演示,让你能够对自己的歌曲进行分类
< > 在 GitHub 上更新