Agents 课程文档

观察：整合反馈以进行反思和调整

Agents 课程

单元 0. 欢迎来到课程

直播 1. 课程运作方式和问答

单元 1. Agent 简介

简介什么是 Agent？快速测验 1 什么是 LLM？消息和特殊 Token 什么是工具？快速测验 2 通过思考-行动-观察循环理解 AI Agent 思考、内部推理和 Re-Act 方法行动，使 Agent 能够与其环境互动观察：整合反馈以进行反思和调整虚拟 Agent 库让我们使用 smolagents 创建我们的第一个 Agent 单元 1 最终测验结论

单元 2. AI Agent 框架

单元 2.1 smolagents 框架

单元 2.2 LlamaIndex 框架

单元 2.3 LangGraph 框架

单元 3. Agentic RAG 的用例

奖励单元 1. 微调用于函数调用的 LLM

奖励单元 2. Agent 可观测性和评估

何时发布后续步骤？

加入 Hugging Face 社区

并获得增强的文档体验

在模型、数据集和 Spaces 上协作

通过加速推理获得更快的示例

切换文档主题

开始使用

观察：整合反馈以进行反思和调整

观察是 Agent 如何感知其行动的后果。

它们提供关键信息，为 Agent 的思考过程提供动力并指导未来的行动。

它们是来自环境的信号——无论是来自 API 的数据、错误消息还是系统日志——引导下一个思考循环。

在观察阶段，Agent

收集反馈： 接收数据或确认其行动是否成功。
附加结果： 将新信息整合到其现有上下文中，有效地更新其记忆。
调整其策略： 使用此更新的上下文来改进后续的想法和行动。

例如，如果天气 API 返回数据“局部多云，15°C，湿度 60%”，则此观察结果将附加到 Agent 的记忆中（在提示的末尾）。

然后，Agent 使用它来决定是否需要更多信息，或者是否准备好提供最终答案。

这种迭代地整合反馈确保了 Agent 始终与其目标保持动态一致，根据真实世界的成果不断学习和调整。

这些观察结果可以采取多种形式，从读取网页文本到监控机器人手臂的位置。这可以看作是工具“日志”，提供行动执行的文本反馈。

观察类型	示例
系统反馈	错误消息、成功通知、状态代码
数据更改	数据库更新、文件系统修改、状态更改
环境数据	传感器读数、系统指标、资源使用情况
响应分析	API 响应、查询结果、计算输出
基于时间的事件	截止日期已到、计划任务已完成

结果如何附加？

执行操作后，框架按顺序执行以下步骤

解析操作 以识别要调用的函数和要使用的参数。
执行操作。
将结果作为观察结果附加。

我们现在学习了 Agent 的思考-行动-观察循环。

如果某些方面仍然有些模糊，请不要担心——我们将在未来的单元中重新审视并深化这些概念。

现在，是时候通过编写您的第一个 Agent 来实践您的知识了！

< > 在 GitHub 上更新

←行动，使 Agent 能够与其环境互动虚拟 Agent 库→