LLMGameHub:我们如何在 Gradio Agents & MCP Hackathon 2025 中获胜

📝 注意:在赢得 Gradio Agents & MCP Hackathon 2025 时,我们的项目名为 LLMGameHub。此后,它已发展为 Immersia,反映了我们对生成式游戏体验更广阔的愿景。
创造。玩。想象。
2025 年 6 月,我的队友和我参加了国际 Gradio Agents & MCP Hackathon——为期一周的多智能体系统和 MCP 实验。在 Agentic Demo Showcase 赛道中,参赛者有一个目标:展示多智能体 LLM 应用程序的真正能力。LLMGameHub 就这样诞生了——一个任何人都可以根据自己的想法和文本在几分钟内创建互动游戏的平台。
创意的诞生
起初是文字,文字是创造力。我们深入思考如何展示多智能体系统的全部力量,同时确保产品对尽可能多的人有吸引力。人们喜欢什么?音乐、电影、游戏……游戏!这才是人们真正喜欢的,它融合了所有创意形式的最佳方面。因此,这个想法诞生了:将文本、图像和音乐的生成模型统一到一个连贯的生态系统中,让用户既能像导演又能像作家一样,创作自己的故事。黑客马拉松是把这个雄心勃勃的概念变成一个完全可操作的原型的绝佳机会。
什么是 LLMGameHub?
LLMGameHub 是一个生成式冒险的游乐场。您描述一个世界,选择一个英雄和一种流派,然后立即投入游戏。故事在屏幕上展开:场景由大型语言模型生成,第一人称图像动态创建,自适应音乐伴随着每个情节转折。所有这些都由 Gradio 界面和后端智能体池提供支持。
每场游戏持续约五分钟,其中有几个选择、互动分支和一个结局。
🚀 它是如何工作的?
LLMGameHub 的核心是一组专门的智能体,每个智能体负责游戏的特定方面
- 故事智能体生成情节场景和玩家动作选项。我们使用 LangGraph 和 LangChain 来构建一个对话图,指导叙事流程。
- 图像智能体使用 Google Gemini 动态创建或修改图像,分析场景并生成提示以第一人称视角可视化它们。
- 音乐智能体通过 Google Lyria 制作氛围配乐,根据叙事动态改变乐曲的情绪。
- 状态管理器将游戏进度存储在 Redis 中,确保逻辑故事的连续性并考虑以前的玩家动作。
所有智能体都异步运行,通过 Gradio Blocks 管理通信,允许用户以最小的延迟查看文本、选择操作、接收图像和聆听音乐。
llm_graph.py
中的节点示例
async def player_step(state: GraphState) -> GraphState:
# Save player's choice
await update_state_with_choice(state.user_hash, state.choice_text)
# Check if the game has reached an ending
ending = await check_ending(state.user_hash)
if ending["ending_reached"]:
state.ending = ending
return state
# Generate the next scene and simultaneously launch music and images
next_scene = await generate_scene(state.user_hash, state.choice_text)
await asyncio.gather(
generate_scene_image(state.user_hash, next_scene),
generate_music_prompt(state.user_hash, next_scene),
)
state.scene = next_scene
return state
此片段演示了在玩家选择后图表如何决定接下来的事件。音乐和图像生成同时启动。
用户界面
我们的目标是让游戏体验和故事创作一样愉快。基于 Gradio 的构建器允许您指定未来故事的背景、主角和流派。点击“开始游戏”后,用户立即沉浸在叙事中:文本、背景插图、互动动作选择和动态音乐。
成功的秘诀
主要的挑战是整合多个生成服务,同时确保可接受的响应时间。我们优化了提示,利用了异步编程,执行了并行生成请求,并将中间结果存储在 Redis 中。这种方法最大限度地缩短了响应时间,并显著增强了用户体验。
接下来是什么?
我们已经在 Hugging Face Spaces 上发布了该项目,并将通过添加新流派和改进音乐生成来继续开发。项目演示可在 YouTube 上观看。
从 LLMGameHub 到 Immersia
LLMGameHub 是我们的起点,也是我们在 Gradio Agents & MCP Hackathon 中获胜时的名称,但我们的雄心已经扩大。为了更好地反映我们的愿景——沉浸式、创意人工智能驱动的游戏——我们将项目更名为 Immersia。这个新名称强调了更深层次的参与、创造力以及不断扩展的生成式游戏能力,我们将在未来继续增强这些能力。
结论
参加黑客马拉松对我们来说真是一次冒险。我们熟悉了强大的工具,拓宽了技术视野,发现多智能体应用程序既实用又极具吸引力。获胜给我们带来了真正的惊喜(尽管我们当然相信自己的能力!),并激励我们在这个激动人心的领域继续发展项目和我们自己。
我们感谢组织者提供了展示我们才华的机会,并邀请大家在我们的网站上支持 Immersia 的持续发展——您的反馈将帮助我们做得更好!