Agents 课程文档
观察:整合反馈以进行反思和调整
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
观察:整合反馈以进行反思和调整
观察是 Agent 如何感知其行动的后果。
它们提供关键信息,为 Agent 的思考过程提供动力并指导未来的行动。
它们是来自环境的信号——无论是来自 API 的数据、错误消息还是系统日志——引导下一个思考循环。
在观察阶段,Agent
- 收集反馈: 接收数据或确认其行动是否成功。
- 附加结果: 将新信息整合到其现有上下文中,有效地更新其记忆。
- 调整其策略: 使用此更新的上下文来改进后续的想法和行动。
例如,如果天气 API 返回数据“局部多云,15°C,湿度 60%”,则此观察结果将附加到 Agent 的记忆中(在提示的末尾)。
然后,Agent 使用它来决定是否需要更多信息,或者是否准备好提供最终答案。
这种迭代地整合反馈确保了 Agent 始终与其目标保持动态一致,根据真实世界的成果不断学习和调整。
这些观察结果可以采取多种形式,从读取网页文本到监控机器人手臂的位置。这可以看作是工具“日志”,提供行动执行的文本反馈。
观察类型 | 示例 |
---|---|
系统反馈 | 错误消息、成功通知、状态代码 |
数据更改 | 数据库更新、文件系统修改、状态更改 |
环境数据 | 传感器读数、系统指标、资源使用情况 |
响应分析 | API 响应、查询结果、计算输出 |
基于时间的事件 | 截止日期已到、计划任务已完成 |
结果如何附加?
执行操作后,框架按顺序执行以下步骤
- 解析操作 以识别要调用的函数和要使用的参数。
- 执行操作。
- 将结果作为观察结果附加。
我们现在学习了 Agent 的思考-行动-观察循环。
如果某些方面仍然有些模糊,请不要担心——我们将在未来的单元中重新审视并深化这些概念。
现在,是时候通过编写您的第一个 Agent 来实践您的知识了!
< > 在 GitHub 上更新