推理提供商文档
音频分类
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
音频分类
音频分类是将标签或类别分配给给定音频的任务。
应用示例
- 识别用户正在发出的命令
- 识别说话人
- 检测歌曲的流派
有关 `audio-classification` 任务的更多详细信息,请查看其专用页面!您将找到示例和相关材料。
推荐模型
在此处探索所有可用模型并找到最适合您的模型。
使用 API
目前没有针对 **audio-classification** 任务的代码片段示例,因为尚无提供商支持它。
API 规范
请求
标头 | ||
---|---|---|
授权 | 字符串 | 认证头格式为`'Bearer: hf_****'`,其中`hf_****`是具有“推理提供商”权限的个人用户访问令牌。您可以从您的设置页面生成一个。 |
有效负载 | ||
---|---|---|
输入* | 字符串 | 以 base64 编码字符串形式提供的输入音频数据。如果未提供 `parameters`,您也可以将音频数据作为原始字节负载提供。 |
参数 | 对象 | |
要应用的函数 | 枚举 | 可能的值:sigmoid、softmax、none。 |
top_k | 整数 | 指定时,将输出限制为最有可能的 K 个类别。 |
响应
正文 | ||
---|---|---|
(数组) | 对象数组 | 输出是一个对象数组。 |
标签 | 字符串 | 预测的类别标签。 |
分数 | 数字 | 对应的概率。 |