hello 大家好,我是@汉森
你是不是也这样,经常到处搜刮好用的「提示词」(Prompt),指望某一个大佬写出来的提示词能让大模型给出惊艳世人的答案?
然而你有没有发现,有时候「神级提示词」也不灵了?
这个时候,「上下文工程」(Context Engineering)出现了,并且很多 AI 大佬也越来越强调「上下文工程」的重要性。
那为什么我们需要一个听起来更复杂的「上下文工程」呢?
答案是:因为 AI 进化的速度,超出了「提示词」这个词的范畴。
所以,「提示词工程」其实只是「上下文工程」的早期形态,或者说是一个子集。
为什么这么说?
因为我们以前玩的 AI 大多是聊天机器人(Chatbot):
你问,它答。
你给「提示词」,它出「答案」

它需要处理的「上下文」:主要就是你输入对话框的那句话
但现在,单纯的聊天已经不能满足我们的工作生产需要了,AI 正在进化成 AI 智能体(Agent)

我们不再只是跟它「聊天」,而是可以直接给它「下指令」
比如,你可以对它说:
"帮我规划一个未来5天的旅行,对比三个目的地,并预订性价比最高的机票酒店。"
它为了完成这个任务,这个过程可能需要执行几十个,甚至上百个"工具调用" (Tool Calls)——比如 "查天气"、"搜航班"、"比价格"、"看酒店评论"、"下单预订"等等。
那么,问题来了: AI 每调用一次工具(比如"查航班"),就会产生一大堆新的信息("航班A,3000元"、"航班B,已售罄")。
这些海量的信息,全都会变成新的「上下文」,需要 AI 去理解和管理。
但是我们都知道,模型毕竟都有上下文限制,越往后它越难以记得前面聊了什么、关键信息是什么。
所以,才会有需要管理上下文的「上下文工程」这个需求
那么,这个 AI 需要理解和管理的「上下文」,都包括什么呢?
「上下文」到底是什么?
AI 发展到如今,「上下文」已经不再只是你发出来的那句话了
它指的是 AI 在回应你之前,所能(且需要)看到的所有信息
打个比方,你请一个真人助理帮你干活,他需要提前知道些什么?
你的规矩 (System Prompt): "你是一个专业的财经助理,回答要简洁、专业。"
你刚说的话 (User Prompt): "帮我分析一下最近的股市。"
咱们的聊天记录 (History): "对了,上次你帮我分析的那个股票涨了..."(这是"短期记忆")
他"记"住的你 (Long-Term Memory): "老板(你)不喜欢太复杂的图表。"(这是"长期记忆")
他刚查到的资料 (RAG): "我刚从数据库里查到,这是最新的三篇研报..."
他能用的"工具" (Tools): 他的电脑上有"查询股价"、"数据分析"、"发送邮件"这几个软件。
工具返回的结果 (Tool Responses): "查询股价"软件告诉他:"XX 股票,今日上涨 5%。"
「上下文工程」的重点就是去动态地管理所有这些信息。记住啊,这个过程是动态的

为了更好的阅读体验,来飞书看吧:
https://f06hod6x38u.feishu.cn/docx/ZCCkdXZwuoti0xxmJ6hcZZoGnDf
Comments on "别只知道喂"提示词"了!AI 圈大佬都在谈的"上下文工程"才是黑科技" :