音频课程文档

补充阅读材料和资源

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

补充阅读材料和资源

本单元整合了前几个单元的许多组件,介绍了语音到语音翻译、语音助手和说话人识别等任务。因此,为方便起见,补充阅读材料分为这三项新任务

语音到语音翻译

语音助手

会议转录

  • pyannote.audio 技术报告,Hervé Bredin:本报告描述了 pyannote.audio 说话人识别管道背后的主要原理
  • Whisper X,Max Bain 等人:使用 Whisper 模型计算单词级时间戳的卓越方法
< > 在 GitHub 上更新