社区计算机视觉课程文档
补充阅读材料和资源 🤗
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
补充阅读材料和资源 🤗
我们希望您觉得多模态模型单元令人兴奋。如果您想深入学习和探索多模态学习和模型,这里列出了一些资源供您参考:
- Hugging Face 任务提供了计算机视觉、音频、自然语言处理、多模态学习和强化学习等领域的各种任务概述。这些任务包含演示、用例、模型、数据集等。
- 卡内基梅隆大学多模态机器学习 (11-777 MMML) 课程。您可以在这里找到视频讲座。
- Chip Huyen 关于多模态和大型语言模型的博客全面概述了多模态、大型多模态模型以及 BLIP、CLIP 等系统。
- Awesome Multimodal ML,一个包含论文、课程、架构、研讨会、教程等的 GitHub 存储库。
- Awesome Multimodal Large Language Models,一个包含与多模态大型语言模型相关的论文和数据集的 GitHub 存储库。
- 加州理工学院 EE/CS 148 大型语言和视觉模型课程。
在下一个单元中,我们将研究另一种近年来因多模态而发生革命性变化的神经网络模型:生成神经网络。准备好您的画笔,与我们一起踏上计算机视觉领域的另一段激动人心的旅程吧 🤠
< > 在 GitHub 上更新