智能体课程文档

观察:整合反馈以反思和调整

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

观察:整合反馈以反思和调整

观察是智能体如何感知其行动结果的方式。

它们提供了关键信息,为智能体的思维过程提供动力并指导未来的行动。

它们是来自环境的信号——无论是来自 API 的数据、错误消息还是系统日志——它们指导下一个思维周期。

在观察阶段,智能体

  • 收集反馈:接收数据或确认其行动是否成功。
  • 附加结果:将新信息整合到其现有上下文中,有效地更新其内存。
  • 调整其策略:使用此更新的上下文来完善后续的思想和行动。

例如,如果天气 API 返回数据“部分多云,15°C,湿度 60%”,则此观察结果将附加到智能体的内存中(在提示符的末尾)。

然后,智能体使用它来决定是否需要额外的信息,或者是否已准备好提供最终答案。

这种迭代地整合反馈确保了智能体与其目标保持动态一致,根据实际结果不断学习和调整。

这些观察可以采取多种形式,从读取网页文本到监控机器人手臂的位置。这可以被视为工具“日志”,它们提供行动执行的文本反馈。

观察类型 示例
系统反馈 错误消息、成功通知、状态码
数据更改 数据库更新、文件系统修改、状态更改
环境数据 传感器读数、系统指标、资源使用情况
响应分析 API 响应、查询结果、计算输出
基于时间的事件 达到截止日期、预定任务完成

结果如何附加?

执行操作后,框架按以下步骤操作

  1. 解析操作以识别要调用的函数和要使用的参数。
  2. 执行操作。
  3. 将结果附加观察结果

我们现在已经学习了智能体的思想-行动-观察周期。

如果某些方面仍然有点模糊,请不要担心——我们将在未来的单元中重新审视和深化这些概念。

现在,是时候通过编写您的第一个智能体来将您的知识付诸实践了!

< > 在 GitHub 上更新