音频课程文档
补充阅读和资源
加入 Hugging Face 社区
并获取增强的文档体验
开始使用
补充阅读和资源
如果您想进一步探索不同的 Transformer 架构,并了解它们在语音处理中的各种应用,请查看这篇最新的论文
语音处理中的 Transformer:综述
作者:Siddique Latif, Aun Zaidi, Heriberto Cuayahuitl, Fahad Shamshad, Moazzam Shoukat, Junaid Qadir
“Transformer 在自然语言处理领域的显著成功激发了语音处理社区的兴趣,促使人们探索它们在语音序列中建模长距离依赖关系方面的潜力。最近,Transformer 在各种语音相关领域获得了突出地位,包括自动语音识别、语音合成、语音翻译、语音副语言学、语音增强、口语对话系统和众多多模态应用。在本文中,我们进行了一项全面的调查,旨在桥接语音技术中不同子领域的研究。通过整合来自整个语音技术领域的发现,我们为有兴趣利用 Transformer 的力量来推进该领域的研究人员提供了宝贵的资源。我们指出了 Transformer 在语音处理中遇到的挑战,同时也为解决这些问题提供了潜在的解决方案。”
< > 在 GitHub 上更新