智能体课程文档
从LLM到AI智能体
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
从LLM到AI智能体
我们在这门课程的第一单元中了解到,AI智能体能够进行规划和决策。
虽然LLM使得与NPC的交互更加自然,但智能体AI更进一步,允许角色做出决策、规划行动并适应不断变化的环境。
为了说明这种差异,请设想一个经典的RPG游戏中的NPC
- 有了LLM:NPC可能会以更自然、更多样化的方式回答你的问题。这对于对话来说非常棒,但NPC仍然是静态的,除非你先做些什么,否则它不会行动。
- 有了智能体AI:即使你不直接与NPC交互,NPC也可以决定去寻求帮助、设置陷阱或完全避开你。
这个小小的转变改变了一切。我们正在从脚本响应者转向游戏世界中的自主行动者。
这一转变意味着NPC现在可以通过目标导向的行为直接与环境交互,最终带来更动态和不可预测的游戏玩法。
智能体AI赋予NPC以下能力
- 自主性:根据游戏状态做出独立决策。
- 适应性:根据玩家行为调整策略。
- 持久性:记住过去的交互以指导未来的行为。
这将NPC从被动实体(响应你的输入)转变为游戏世界中积极的参与者,为创新游戏玩法打开了大门。
智能体的主要限制:目前它很慢
然而,我们现在还不能过于乐观。尽管智能体AI潜力巨大,但目前在实时应用中仍面临挑战。
推理和规划过程会引入延迟,使其不适合像《毁灭战士》或《超级马里奥兄弟》这样的快节奏游戏。
以克劳德玩宝可梦为例。如果你考虑到思考所需的令牌数量,再加上行动所需的令牌数量,就会清楚地发现,我们需要完全不同的解码策略才能实现实时游戏。

大多数游戏需要以每秒30帧左右的速度运行,这意味着实时AI智能体需要每秒行动30次,这对于当前的智能体LLM来说是不可行的。
然而,像《宝可梦》这样的回合制游戏是理想的选择,因为它们允许AI有足够的时间进行思考并做出战略决策。
这就是为什么在下一节中,你将构建自己的AI智能体,在宝可梦风格的回合制战斗中进行对战,甚至可以亲自挑战它。让我们开始吧!
< > 在 GitHub 上更新