上下文工程:超越提示工程的演进
什么是上下文工程?
上下文工程是一门综合性学科,它作为人工智能系统设计的下一代演进,远远超越了传统的提示工程。上下文工程的核心是设计和优化大型语言模型(LLM)和高级人工智能模型有效执行任务的指令和相关上下文的过程。更广义地说,它涵盖了对影响人工智能系统如何运作的环境、输入数据和交互流程进行战略性设计和结构化。
与专注于为特定任务设计单个提示的提示工程不同,上下文工程采用整体方法来构建智能系统,这些系统可以维护状态、动态访问相关信息,并在多重交互和复杂工作流程中有效运作。
核心原则和组成部分
上下文工程基于几个基本原则,这些原则使其与更简单的方法区别开来。
系统级设计
上下文工程将人工智能系统视为完整的生态系统,而非单独的提示-响应交互。这包括设计定义人工智能应如何行为的规则和指南的系统指令(或系统提示)、管理对话历史和内存,以及集成外部数据源和工具。
动态信息管理
上下文工程的一个关键方面是汇集所有相关的背景、记忆和工具,以便人工智能能够在多个回合和任务中有效响应。这包括创建能够根据每次交互的具体上下文动态检索和整合相关信息的系统。
多模态上下文优化
随着人工智能系统变得更加复杂,上下文工程超越了基于文本的交互,延伸到多模态模型的上下文优化,将视觉、音频和其他数据类型整合到上下文框架中。
关键技术和方法论
检索增强生成(RAG)
检索增强生成(RAG)是上下文工程的基础模式。RAG 代表一种基本技术,它从外部知识源动态检索相关信息,并将其整合到人工智能的上下文中,然后生成响应。这使得人工智能系统能够访问其训练数据之外的最新信息,并提供更准确、更具上下文相关性的响应。
上下文嵌入和高级检索
现代上下文工程采用复杂的检索技术,包括上下文嵌入,当与BM25等技术结合使用时,可以将前20块检索失败率降低多达49%。这些方法确保最相关的信息成功检索并整合到人工智能的工作上下文中。
全局状态管理
LlamaIndex 等上下文工程框架实现了全局状态/上下文管理,允许系统将工作流上下文用作一种可以存储和检索代理步骤的全局信息的便笺。这使得在多次交互中能够实现长期记忆和连续性。
工具集成和编排
上下文工程的一个关键组成部分是根据上下文动态调用工具和功能,这包括清晰地格式化工具输出并提供后续指令,以便将结果整合到响应中。
上下文工程与提示工程
上下文工程与提示工程的根本区别在于范围和方法。
范围和思维方式
- 提示工程侧重于为单个输入-输出对设计清晰的指令,并在单次交互中运作。
- 上下文工程设计模型思维过程的整个流程和架构,处理模型所看到的一切,包括记忆、历史、工具和系统提示。
时间视角
提示工程是“即时性”的,针对的是特定的输入,而上下文工程则比提示工程更进一步,它侧重于构建能够随着时间推移保持上下文和状态的系统。
关系
重要的是,提示工程是上下文工程的一个子集,反之则不然。上下文工程涵盖了提示设计,但远远超出了提示设计,包括系统架构、数据策略和用户体验设计。
应用和用例
企业级AI系统
上下文工程对于需要跨部门、用例和数据源进行扩展的企业级AI尤其有价值。提示工程适用于原型设计或面向消费者的应用程序,而上下文工程对于需要可靠性、一致性以及与现有系统集成的复杂业务应用程序至关重要。
AI智能体和自主系统
上下文工程支持自主的、多轮的、以及能够适应用户不断变化的需求的工具增强型AI。这包括构建能够执行长期任务、处理多个信息源并记住对话上下文的AI代理。
文档分析和知识管理
Box等公司正在利用上下文工程和Gemini嵌入模型来从复杂文档中回答问题和提取见解,在信息检索任务中实现了F1分数的显著提高。
代码开发和技术应用
上下文工程为高级编码助手提供支持,使其能够索引代码库并执行语义搜索,从而实现更复杂的开发工作流,这些工作流可以维护整个软件项目的上下文,而不仅仅是单个代码片段。
工具和技术
LlamaIndex和LlamaCloud
LlamaIndex提供了实现上下文工程原则的综合框架,提供工作流上下文管理和构建能够维护多步骤全局状态的代理系统的工具。
LangChain和LangGraph
这些框架提供了代理编排的综合框架,对于围绕工具使用的上下文工程特别有用,提供了管理可用工具、提供语法指南和模板化工具结果整合的能力。
嵌入模型和向量数据库
现代上下文工程高度依赖于高级嵌入模型,例如Gemini Embedding,它们为RAG系统的检索组件提供支持,并实现大型知识库的语义搜索。
上下文检索系统
结合上下文嵌入与BM25和重排等技术的高级检索系统,可显著提高检索准确性和相关性。
挑战和注意事项
数据隐私和负责任的AI
上下文工程必须解决数据隐私、偏见和负责任的AI使用问题。由于这些系统访问和处理大量上下文信息,确保适当的数据治理和伦理AI实践变得至关重要。
复杂性管理
构建有效的上下文工程系统需要以提示工程从未做过的方式思考信息架构、数据策略和用户体验。这种增加的复杂性要求人工智能从业者具备新的技能和方法。
性能和可扩展性
随着上下文工程系统变得越来越复杂,管理维护上下文、检索相关信息和编排工具的计算开销成为一个重大的工程挑战。
未来方向
上下文工程代表着构建智能、可靠且企业就绪的AI系统的新基础。随着该领域的发展,我们可以期待看到:
- 更复杂的内存和状态管理系统
- 更好地与企业数据源和工作流集成
- 高级多模态上下文管理功能
- 改进的调试和优化上下文系统工具
- 更加重视负责任的AI和伦理上下文管理
从提示工程到上下文工程的转变反映了人工智能从简单的问答系统发展到能够在复杂现实环境中有效运作的综合推理引擎。通过超越提示工程,拥抱动态、整体的上下文管理,组织可以充分发挥大型语言模型和代理AI的潜力。
这篇全面的概述表明,上下文工程不仅仅是一个流行词,它代表着我们处理人工智能系统设计方式的根本性转变,从孤立的交互转向能够保持连续性、动态访问相关信息并在企业环境中有效运作的复杂、上下文感知系统。