音频课程文档

补充阅读和资源

Hugging Face's logo
加入 Hugging Face 社区

并获取增强的文档体验

开始使用

补充阅读和资源

如果您想进一步探索不同的 Transformer 架构,并了解它们在语音处理中的各种应用,请查看这篇最新的论文

语音处理中的 Transformer:综述

作者:Siddique Latif, Aun Zaidi, Heriberto Cuayahuitl, Fahad Shamshad, Moazzam Shoukat, Junaid Qadir

“Transformer 在自然语言处理领域的显著成功激发了语音处理社区的兴趣,促使人们探索它们在语音序列中建模长距离依赖关系方面的潜力。最近,Transformer 在各种语音相关领域获得了突出地位,包括自动语音识别、语音合成、语音翻译、语音副语言学、语音增强、口语对话系统和众多多模态应用。在本文中,我们进行了一项全面的调查,旨在桥接语音技术中不同子领域的研究。通过整合来自整个语音技术领域的发现,我们为有兴趣利用 Transformer 的力量来推进该领域的研究人员提供了宝贵的资源。我们指出了 Transformer 在语音处理中遇到的挑战,同时也为解决这些问题提供了潜在的解决方案。”

arxiv.org/abs/2303.11607

< > 在 GitHub 上更新