← → 翻页 · ESC 索引
AI 编程技术 · 演进史
2020 — 2026
从提示词到驾驭工程

AI 编程的
五次演进

Prompt Engineering → Context Engineering → MCP → Skills → Harness Engineering

Notion·2026
技术演进 · 深层逻辑
— 2026 —
第一阶段 · Phase I
Act I · 02 / 29
Phase I · 2020

Prompt
Engineering

提示词工程 · AI 编程的原点

第一阶段
— · —
第一阶段 · Prompt Engineering
03 / 29
Contextual Learning · 2020

GPT-3 · 上下文学习的诞生

一个精心构造的提示词,加上两三个示例,就能让模型在完全陌生的任务上表现良好。

CoT
Chain-of-Thought
链式推理,让 AI 一步步思考
Few-shot
Few-shot Learning
两三个示例,立刻适应新任务
Role
Role Prompting
角色扮演,指定 AI 的身份
提示词工程 · 核心技术
Act I · PE Techniques
第一阶段 · 提示词工程的局限
04 / 29
The Bottleneck · 瓶颈

提示词工程的
三大局限

一次性的 · 不可记忆
每次对话都要重新输入所有上下文,AI 不会记得之前学到的内容
文字带宽受限
大量背景信息、多个约束、特定规范——纯文字越来越长、越来越拗口
信息翻译失真
人的直觉和业务理解,往往比文字表达更丰富,翻译过程本身容易失真
提示词工程 · 局限性
Act I · Limitations
第一阶段 · 上下文瓶颈
05 / 29
GitHub Copilot · 2021

上下文窗口
的约束

AI 只能看到当前文件的几千个 token,对于整个代码仓库的上下文一无所知。

"Copilot 给出的补全建议时好时坏,有时候完全正确,有时候完全不着边际。"
Context Window
4K
GPT-3 时代
Context Window
128K
GPT-4o 时代
Context Window
200K
Claude 3.5
第一阶段 · 转折点
— · —
第二阶段 · Phase II
Act II · 06 / 29
Phase II · 2023

Context
Engineering

上下文工程 · 从"怎么问"到"给什么"

第二阶段
— · —
第二阶段 · Context Engineering
07 / 29
Core Insight · 核心洞察

问题不只是"怎么问",
而是"给 AI 什么信息环境"

RAG
检索增强生成
从知识库检索相关内容,与用户问题一起交给大模型生成答案
Mem
Session Memory
跨对话的连续性,让 AI 记住之前的交互历史
Rules
Persistent Rules
如 .cursorrules,定义代码规范、架构原则,不需每次重新输入
上下文工程 · 三大模式
Act II · CE Patterns
第二阶段 · Vibe Coding
08 / 29
Andrej Karpathy · 2025.02

"Vibe Coding"

用直觉编程,把结构性决策委托给 AI,接受它生成的任何结果。

越是能力强大的 AI,
越需要高质量的上下文环境
来引导它做出正确决策
—— Vibe Coding 实验结论
第二阶段 · Vibe Coding
Act II · Karpathy
第三阶段 · Phase III
Act III · 09 / 29
Phase III · 2024

MCP

Model Context Protocol · 连接的标准

第三阶段
— · —
第三阶段 · 碎片化困局
10 / 29
The Problem · 碎片化

MCP 之前:
每接一个工具,写一套代码

AI 需要连接文件系统、Git、数据库、搜索引擎、企业内部 API……每个工具的接入方式都不同。OpenAI 的工具格式和 Anthropic 的不一样,Google 的又不一样。

N×M
N 个模型 × M 个工具
每个 AI 模型和每个工具之间都需要定制开发。5 个模型接 10 个工具 = 50 套集成代码。
Lock-in
厂商锁定
用 OpenAI 的格式写了工具集成,想换 Claude 就得全部重写。迁移成本极高。
Dup
重复造轮子
每个团队都在写类似的集成代码——Git 连接、文件读写、数据库查询——做的是完全相同的事。
碎片化困局
Act III · Problem
第三阶段 · 技术架构
11 / 29
Architecture · Client-Server

MCP 的架构设计

AI 应用(如 Claude Code)作为 Host,内嵌 MCP Client;外部工具(文件系统、Git、数据库)作为 Server。Client 和 Server 之间通过标准协议通信,互相不需要知道对方的内部实现。N×M 的集成问题变成了 N+M。

Host
Host 应用
Claude Code、Cursor、Windsurf 等 AI 编程工具,它们内嵌 MCP Client,发起连接请求。
Client
MCP Client
与 Server 保持 1:1 连接,处理协议通信。一个 Host 可以同时运行多个 Client 连接不同的 Server。
Server
MCP Server
提供具体能力:文件读写、Git 操作、数据库查询。每个 Server 独立运行,实现一次即可被所有 Host 使用。
MCP · 架构
Act III · Architecture
第三阶段 · 核心能力
12 / 29
Three Primitives · 三大原语

Tools · Resources · Prompts

01
Tools(工具)
让 AI 能够执行操作:读写文件、调用 API、执行代码、查询数据库。每个工具都有明确的输入输出规范,AI 知道该传什么参数。
02
Resources(资源)
让 AI 能够获取信息:文件内容、数据库记录、API 响应。Resources 是只读的,为 AI 提供上下文,而不执行副作用操作。
03
Prompts(提示模板)
预定义的提示词模板,包含特定任务的指令和上下文。让复杂任务可以被标准化复用,不需要每次重新构造提示词。
三种原语覆盖了 AI 与外部世界交互的所有核心模式:做、看、学。
—— MCP 设计哲学
MCP · 核心能力
Act III · Primitives
第三阶段 · MCP
13 / 29
Anthropic · 2024.11

MCP = AI 的 USB 接口

就像 USB 统一了所有外设的连接方式,MCP 统一了 AI 模型与外部工具的连接方式。实现一次 MCP Server,任何支持 MCP 的 AI 都能用。N×M 的集成问题变成了 N+M。

OpenAI
2025
正式支持 MCP
Google
2025
Gemini 接入 MCP
Microsoft
2025
VS Code 原生支持
Governance
LF
Linux Foundation 接管
MCP · 开放标准
Act III · MCP
第三阶段 · MCP 生态
14 / 29
2026.02 · 月下载量
9700 万次

MCP SDK 月下载量,标志着 MCP 从一家公司的技术方案成为行业基础设施。

MCP · 行业基础设施
Act III · Stats
第四阶段 · Phase IV
Act IV · 15 / 29
Phase IV · 2025

Skills

技能系统 · 能力的封装与复用

第四阶段
— · —
第四阶段 · Skills
16 / 29
Progressive Disclosure · 渐进式披露

操作手册:
什么时候用什么、怎么用

USB
MCP 是接口
MCP 是 USB 接口,工具是基于接口的设备
Skill
Skill 是手册
技能是基于设备的操作手册,告诉 AI 怎么用
26+
平台采纳
Microsoft、OpenAI、Cursor、GitHub、Gemini CLI 等
Agent Skill 是一个结构化的自包含包,AI agent 可以在任务落在该技能范围内时动态加载它
—— Anthropic · agentskills.io · 2025.12
技能系统 · 定义
Act IV · Skills
第四阶段 · Skill 结构解剖
17 / 29
Anatomy · 结构解剖

一个 Skill 包含什么

Skill 是一个结构化的自包含包,当任务落在该技能范围内时,AI 会动态加载它。一个完整的 Skill 包含四个核心组成部分:

A.
触发条件
什么样的任务应该激活这个 Skill?通过关键词、任务类型、上下文特征来匹配。
B.
知识注入
Skill 被激活后,自动注入相关的领域知识、最佳实践、参考示例。不需要在提示词里预先写入。
C.
执行步骤
按什么顺序调用哪些 MCP 工具?每一步的输入输出是什么?遇到异常如何处理?
D.
输出模板
最终交付物的格式和标准。代码类 Skill 输出代码+测试,分析类 Skill 输出报告+建议。
Agent Skill 是一个结构化的自包含包,AI agent 可以在任务落在该技能范围内时动态加载它。
—— Anthropic · agentskills.io · 2025.12
Skill · 结构
Act IV · Anatomy
第四阶段 · 平台采纳
18 / 29
Adoption · 26+ 平台采纳

谁在用 Skills

从 Anthropic 发布 agentskills.io 标准开始,Skills 已经被 26+ 主流 AI 平台采纳。这个数字还在快速增长。

Anthropic
Claude Code · Skills 原创
Microsoft
VS Code · GitHub Copilot
OpenAI
ChatGPT · Codex
Google
Gemini CLI · Jules
Skills 标准正在成为 AI 工具生态的通用能力描述语言。
—— 2025.12 · agentskills.io 发布
Skills · 平台生态
Act IV · Ecosystem
第五阶段 · Phase V
Act V · 19 / 29
Phase V · 2026

Harness
Engineering

驾驭工程 · 让 AI 可靠运行的新学科

第五阶段
— · —
第五阶段 · 驾驭工程
20 / 29
Ryan Lopopolo · OpenAI · 2026.02
每当 AI agent 犯一个错误,工程师应该构建一个解决方案,确保这个 agent 永远不再犯这个特定的错误。
Agent = Model + Harness
—— LangChain · 公式

光有大模型不够,必须有"驾驭层"来管理 AI 的整个执行生命周期——人机交互、子 Agent 管理、文件系统访问、Prompt 预设、生命周期钩子、任务规划。Model 是能力,Harness 是可靠性。

驾驭工程 · 核心理念
Act V · HE
第五阶段 · 三层驾驭架构
21 / 29
Three-layer Harness Architecture

三层驾驭架构

01
约束 Harness
在错误发生之前就阻止它。通过规则检查操作是否合规,防止 AI 绕过关卡而不真正修复问题。
02
反馈循环
错误发生之后让 AI 有能力自我修正。系统检测异常后,自动把错误上下文返回给 AI,让它重新推理。
03
质量门
AI 完成任务后、代码被合并之前,进行全面合规性检查。传统 CI 不足以应对 AI 生成代码的特殊问题。
驾驭工程 · 三层架构
Act V · Architecture
第五阶段 · 案例研究
22 / 29
Best Practice · 最佳案例

Claude Code:
Harness 的最佳样本

权限
权限模型默认只读
任何文件修改都需要用户显式批准
快照
自动快照
每次修改前自动保存,出了任何问题都可以一键回滚
钩子
Hooks 系统
在关键节点注入安全扫描、linting、合规性检查
上下文
CLAUDE.md
给 AI 持久化的项目上下文
AI 有能力,但能力的边界被明确划定。
案例 · Claude Code
Act V · Case
第五阶段 · 行业案例
23 / 29
Who's Rewriting Harness

谁在重写 Harness

Manus
6 个月重写 Harness 5 次。每次重写都源于一个具体失败案例——某个场景下 AI 行为失控,团队不是打补丁,而是从根本上重新设计 Harness 的约束机制。
5 次
LangChain
一年内对 Open Deep Research 重构 4 次。Harness 是一个需要持续迭代的工程对象,不是一次性设计好的静态系统。
4 次
Vercel
移除了 agent 80% 的工具,反而获得了更少步骤、更少 token、更快响应。Harness 设计的核心不是"让 AI 能做更多",而是"让 AI 在关键事情上更可靠"。
精简
行业案例
Act V · Cases
深层逻辑 · Deep Logic
Deep Logic · 24 / 29
Beyond the Five Phases

深层逻辑

为什么技术按照这个顺序演进?

深层逻辑
— · —
深层逻辑 · 演进因果链
25 / 29
The Logic · 因果链

每个阶段都解决了
上一阶段的根本局限

五次演进不是随机发生的,而是沿着一条严密的因果链:

PE→CE
提示词工程撞上了上下文墙——AI 能力再强,看不到项目上下文也白搭。于是从"怎么问"升级为"给什么信息环境"。
信息
CE→MCP
上下文工程解决了信息问题,但工具接入是碎片化的——每接一个新工具就要写一套定制代码。于是需要标准协议统一工具连接。
连接
MCP→Skills
有了标准接口,工具可以接了,但 AI 不知道什么时候该用什么工具。于是需要"操作手册"来指导 AI 在正确时机使用正确工具。
运用
Skills→HE
AI 有了工具、知道怎么用,但它会犯错。一个不可靠的 Agent 比没有 Agent 更危险。于是需要"驾驭层"来确保可靠运行。
可靠
能力 → 信息 → 连接 → 运用 → 可靠——这是 AI 编程技术走向成熟的必经之路。
演进逻辑 · 因果链
Deep Logic
实践意义 · For Engineers
26 / 29
What It Means · 现实指导

对工程师意味着什么

PE
学会与 AI 对话
CoT、Few-shot、Role Prompting 仍然是日常最常用的技巧。它们是所有高级技术的基础。
CE
构建信息环境
不要只关注提示词怎么写,要关注为 AI 构建什么样的信息环境:知识库、记忆系统、持久化规则。
HE
设计可靠系统
不要只追求 AI 能做什么,要设计让 AI 不犯错的系统:约束、反馈循环、质量门禁。可靠性才是生产力的保障。
掌握底层逻辑,比追逐具体工具更重要。工具会变,逻辑不变。
实践意义
For Engineers
完整技术演进时间线
27 / 29
Evolution Timeline · 2017 — 2026
2017
Transformer 架构发布 · PE 技术基础
2020
GPT-3 发布 · 第一阶段:PE
PE
2021
GitHub Copilot 发布 · 上下文瓶颈首次暴露
2022
ChatGPT 发布,PE 普及 · 第一阶段全盛
PE
2023-24
Cursor / Claude Code / Windsurf 崛起 · CE 系统化
CE
2024.11
Anthropic 发布 MCP · 第三阶段:MCP
MCP
2025.10
Anthropic 发布 Agent Skills · 第四阶段:Skills
Skills
2026.02
Harness Engineering 正式定义 · 第五阶段:HE
HE
技术演进 · 时间线
— · —
核心收获 · Takeaways
30 / 31
The Takeaway · 五个核心收获

五个关键认知

01
技术从"怎么说"进化到"给什么"再到"怎么保证"——每一层都在解决上一层的根本局限。
02
每个阶段是叠加而非替代——PE 仍然是基础,CE 是增强,MCP 是标准化,Skills 是封装,HE 是保障。
03
标准接口击败定制集成——MCP 证明了统一协议的价值,N×M 变成了 N+M。
04
能力不可靠就是危险——一个会犯错但看起来对的 Agent,比一个不会做事的 Agent 更可怕。
05
未来属于能驾驭 AI 的人——不是最会写提示词的人,而是最懂得构建信息环境、设计可靠系统的人。
核心收获
Takeaways
结语 · Closing
31 / 31
The Takeaway

掌握逻辑,
比追逐工具更重要

技术的发展永远比任何文章都快,但底层逻辑变化很慢。理解了从提示词到驾驭工程的五次演进,你就拥有了判断任何新工具的坐标系。
从提示词到驾驭工程·2026
从提示词到驾驭工程
— 2026 —