社区计算机视觉课程文档
补充阅读和资源 🤗
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
补充阅读和资源 🤗
我们希望您觉得关于多模态模型的单元令人兴奋。如果您想详细学习和探索关于多模态学习和模型的内容,以下是一些资源供您参考:
- Hugging Face Tasks 提供了计算机视觉、音频、自然语言处理、多模态学习和强化学习等领域中各种任务的概述。这些任务包含演示、用例、模型、数据集等。
- 11-777 MMML 课程,卡内基梅隆大学多模态机器学习课程。您可以在这里找到视频讲座。
- Chip Huyen 关于多模态和 LLM 的博客 全面概述了多模态、大型多模态模型以及 BLIP、CLIP 等系统。
- Awesome Multimodal ML,一个 GitHub 存储库,包含论文、课程、架构、研讨会、教程等。
- Awesome Multimodal Large Language Models,一个 GitHub 存储库,包含与多模态 LLM 相关的论文和数据集。
- EE/CS 148, Caltech 课程,加州理工学院大型语言和视觉模型课程。
在下一个单元中,我们将看看另一种神经网络模型,这种模型在近几年被多模态彻底革新:生成神经网络。准备好你的画笔,加入我们,在计算机视觉领域展开另一场激动人心的冒险吧 🤠
< > 在 GitHub 上更新