补充阅读和资源 🤗
我们希望您觉得多模态模型这一单元令人兴奋。如果您想深入学习和探索多模态学习和模型,以下列出了供您参考的一些资源。
- Hugging Face 任务 提供了计算机视觉、音频、自然语言处理、多模态学习和强化学习等领域各种任务的概述。这些任务包含演示、用例、模型、数据集等。
- 11-777 MMML 课程是由 CMU 提供的多模态机器学习课程。您可以在 这里 找到视频讲座。
- Chip Huyen 关于多模态和大型语言模型的博客 对多模态、大型多模态模型、BLIP、CLIP 等系统进行了全面概述。
- Awesome Multimodal ML,一个 GitHub 存储库,包含论文、课程、架构、研讨会、教程等。
- Awesome Multimodal Large Language Models,一个 GitHub 存储库,包含与多模态大型语言模型相关的论文和数据集。
- EE/CS 148, Caltech 关于大型语言和视觉模型的课程。
在下一单元中,我们将了解另一种神经网络模型,它在过去几年中因多模态而发生了翻天覆地的变化:生成式神经网络。准备好您的画笔,加入我们一起在计算机视觉领域进行另一段激动人心的冒险吧🤠
< > 更新 在 GitHub 上