推理提供商文档

音频分类

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

音频分类

音频分类是将标签或类别分配给给定音频的任务。

应用示例

  • 识别用户正在发出的命令
  • 识别说话人
  • 检测歌曲的流派

有关 `audio-classification` 任务的更多详细信息,请查看其专用页面!您将找到示例和相关材料。

推荐模型

在此处探索所有可用模型并找到最适合您的模型。

使用 API

目前没有针对 **audio-classification** 任务的代码片段示例,因为尚无提供商支持它。

API 规范

请求

标头
授权 字符串 认证头格式为`'Bearer: hf_****'`,其中`hf_****`是具有“推理提供商”权限的个人用户访问令牌。您可以从您的设置页面生成一个。
有效负载
输入* 字符串 以 base64 编码字符串形式提供的输入音频数据。如果未提供 `parameters`,您也可以将音频数据作为原始字节负载提供。
参数 对象
        要应用的函数 枚举 可能的值:sigmoid、softmax、none。
        top_k 整数 指定时,将输出限制为最有可能的 K 个类别。

响应

正文
(数组) 对象数组 输出是一个对象数组。
        标签 字符串 预测的类别标签。
        分数 数字 对应的概率。
< > 在 GitHub 上更新