使用 Docker 在本地运行 GPT-OSS 模型！

社区文章发布于 2025 年 8 月 6 日

基于 Docker 的 GPT-OSS 聊天机器人

使用 Docker 在您自己的代码库中本地运行 OpenAI 的开源 GPT-OSS 模型（117B / 21B）。此项目避免使用 Open WebUI 或 LM Studio 等第三方 GUI，以帮助您学习如何在应用程序中直接使用基于 GPT 的模型。

所有内容都通过 Docker 容器化，以实现干净、可重现的设置。这是一个有趣的辅助项目，旨在帮助其他人探索本地运行强大的语言模型。

✨ 欢迎贡献！
如果您想协作或进一步增强项目，请随时fork 该存储库并提交拉取请求。

项目仓库：GitHub Repo

OpenAI 根据 Apache 2.0 发布了 GPT-OSS 模型。以下是学习路径：

gpt-oss-chatbot-dockerized/

├── backend/
│ ├── main.py
│ └── requirements.txt
├── frontend/
│ └── index.html
├── docker-compose.yml
└── Dockerfile

克隆仓库

git clone https://github.com/Imran-ml/gpt-oss-app-open-source
cd gpt-oss-app-open-source

导航到项目目录：确保您位于 gpt-oss-app-open-source 目录中。
使用 Docker Compose 构建并运行应用程序
- 根据 Dockerfile 构建后端 Docker 镜像。
- 拉取 ollama/ollama 镜像和 nginx:alpine 镜像。
- 启动所有已定义的服务（Ollama、后端、前端）。
- ollama 服务配置为在启动时自动拉取 gpt-oss 模型。首次运行时可能需要一些时间，因为需要下载模型。在 docker-compose 中，在这一行 "sh -c "ollama serve & sleep 5 && ollama pull gpt-oss && tail -f /dev/null""，您可以将 gpt-oss 替换为 gpt-oss:120b，如果您想要 120B 模型的话！
```
docker-compose up --build
```
您将在终端中看到所有容器的日志。
访问聊天机器人：服务启动并运行后
- 打开您的 Web 浏览器，访问：https://:8080 与聊天机器人交互。
- 后端 API 可在 https://:8000 访问。
- Ollama API 位于 https://:11434。

姓名: 穆罕默德·伊姆兰·扎曼

职位: 首席机器学习工程师

专业链接: - HuggingFace: 个人资料 - Kaggle: 个人资料 - LinkedIn: 个人资料 - Google Scholar: 个人资料 - Medium: 个人资料

这很好，但需要添加一些关于需要在 compose 文件中添加 GPU 的评论

runtime: nvidia
environment:
  - NVIDIA_VISIBLE_DEVICES=all
  - OLLAMA_NUM_GPU=1

通过拖放到文本输入框、粘贴或点击此处上传图片、音频和视频。

点击或粘贴此处以上传图片

· 注册或登录发表评论