Agents 课程文档

观察:整合反馈以进行反思和调整

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

观察:整合反馈以进行反思和调整

观察是 Agent 如何感知其行动的后果

它们提供关键信息,为 Agent 的思考过程提供动力并指导未来的行动。

它们是来自环境的信号——无论是来自 API 的数据、错误消息还是系统日志——引导下一个思考循环。

在观察阶段,Agent

  • 收集反馈: 接收数据或确认其行动是否成功。
  • 附加结果: 将新信息整合到其现有上下文中,有效地更新其记忆。
  • 调整其策略: 使用此更新的上下文来改进后续的想法和行动。

例如,如果天气 API 返回数据“局部多云,15°C,湿度 60%”,则此观察结果将附加到 Agent 的记忆中(在提示的末尾)。

然后,Agent 使用它来决定是否需要更多信息,或者是否准备好提供最终答案。

这种迭代地整合反馈确保了 Agent 始终与其目标保持动态一致,根据真实世界的成果不断学习和调整。

这些观察结果可以采取多种形式,从读取网页文本到监控机器人手臂的位置。这可以看作是工具“日志”,提供行动执行的文本反馈。

观察类型 示例
系统反馈 错误消息、成功通知、状态代码
数据更改 数据库更新、文件系统修改、状态更改
环境数据 传感器读数、系统指标、资源使用情况
响应分析 API 响应、查询结果、计算输出
基于时间的事件 截止日期已到、计划任务已完成

结果如何附加?

执行操作后,框架按顺序执行以下步骤

  1. 解析操作 以识别要调用的函数和要使用的参数。
  2. 执行操作。
  3. 结果作为观察结果附加

我们现在学习了 Agent 的思考-行动-观察循环。

如果某些方面仍然有些模糊,请不要担心——我们将在未来的单元中重新审视并深化这些概念。

现在,是时候通过编写您的第一个 Agent 来实践您的知识了!

< > 在 GitHub 上更新