AI 编程技术 · 演进史

2020 — 2026

从提示词到驾驭工程

AI 编程的
五次演进

Prompt Engineering → Context Engineering → MCP → Skills → Harness Engineering

Notion·2026

技术演进 · 深层逻辑

— 2026 —

第一阶段 · Phase I

Act I · 02 / 29

Phase I · 2020

Prompt
Engineering

提示词工程 · AI 编程的原点

第一阶段

— · —

第一阶段 · Prompt Engineering

03 / 29

Contextual Learning · 2020

GPT-3 · 上下文学习的诞生

一个精心构造的提示词，加上两三个示例，就能让模型在完全陌生的任务上表现良好。

CoT

Chain-of-Thought

链式推理，让 AI 一步步思考

Few-shot

Few-shot Learning

两三个示例，立刻适应新任务

Role

Role Prompting

角色扮演，指定 AI 的身份

提示词工程 · 核心技术

Act I · PE Techniques

第一阶段 · 提示词工程的局限

04 / 29

The Bottleneck · 瓶颈

提示词工程的
三大局限

一次性的 · 不可记忆

每次对话都要重新输入所有上下文，AI 不会记得之前学到的内容

文字带宽受限

大量背景信息、多个约束、特定规范——纯文字越来越长、越来越拗口

信息翻译失真

人的直觉和业务理解，往往比文字表达更丰富，翻译过程本身容易失真

提示词工程 · 局限性

Act I · Limitations

第一阶段 · 上下文瓶颈

05 / 29

GitHub Copilot · 2021

上下文窗口
的约束

AI 只能看到当前文件的几千个 token，对于整个代码仓库的上下文一无所知。

"Copilot 给出的补全建议时好时坏，有时候完全正确，有时候完全不着边际。"

Context Window

4K

GPT-3 时代

Context Window

128K

GPT-4o 时代

Context Window

200K

Claude 3.5

第一阶段 · 转折点

— · —

第二阶段 · Phase II

Act II · 06 / 29

Phase II · 2023

Context
Engineering

上下文工程 · 从"怎么问"到"给什么"

第二阶段

— · —

第二阶段 · Context Engineering

07 / 29

Core Insight · 核心洞察

问题不只是"怎么问"，
而是"给 AI 什么信息环境"

RAG

检索增强生成

从知识库检索相关内容，与用户问题一起交给大模型生成答案

Mem

Session Memory

跨对话的连续性，让 AI 记住之前的交互历史

Rules

Persistent Rules

如 .cursorrules，定义代码规范、架构原则，不需每次重新输入

上下文工程 · 三大模式

Act II · CE Patterns

第二阶段 · Vibe Coding

08 / 29

Andrej Karpathy · 2025.02

"Vibe Coding"

用直觉编程，把结构性决策委托给 AI，接受它生成的任何结果。

越是能力强大的 AI，
越需要高质量的上下文环境
来引导它做出正确决策

—— Vibe Coding 实验结论

第二阶段 · Vibe Coding

Act II · Karpathy

第三阶段 · Phase III

Act III · 09 / 29

Phase III · 2024

MCP

Model Context Protocol · 连接的标准

第三阶段

— · —

第三阶段 · 碎片化困局

10 / 29

The Problem · 碎片化

MCP 之前：
每接一个工具，写一套代码

AI 需要连接文件系统、Git、数据库、搜索引擎、企业内部 API……每个工具的接入方式都不同。OpenAI 的工具格式和 Anthropic 的不一样，Google 的又不一样。

N×M

N 个模型 × M 个工具

每个 AI 模型和每个工具之间都需要定制开发。5 个模型接 10 个工具 = 50 套集成代码。

Lock-in

厂商锁定

用 OpenAI 的格式写了工具集成，想换 Claude 就得全部重写。迁移成本极高。

Dup

重复造轮子

每个团队都在写类似的集成代码——Git 连接、文件读写、数据库查询——做的是完全相同的事。

碎片化困局

Act III · Problem

第三阶段 · 技术架构

11 / 29

Architecture · Client-Server

MCP 的架构设计

AI 应用（如 Claude Code）作为 Host，内嵌 MCP Client；外部工具（文件系统、Git、数据库）作为 Server。Client 和 Server 之间通过标准协议通信，互相不需要知道对方的内部实现。N×M 的集成问题变成了 N+M。

Host

Host 应用

Claude Code、Cursor、Windsurf 等 AI 编程工具，它们内嵌 MCP Client，发起连接请求。

Client

MCP Client

与 Server 保持 1:1 连接，处理协议通信。一个 Host 可以同时运行多个 Client 连接不同的 Server。

Server

MCP Server

提供具体能力：文件读写、Git 操作、数据库查询。每个 Server 独立运行，实现一次即可被所有 Host 使用。

MCP · 架构

Act III · Architecture

第三阶段 · 核心能力

12 / 29

Three Primitives · 三大原语

Tools · Resources · Prompts

01

Tools（工具）

让 AI 能够执行操作：读写文件、调用 API、执行代码、查询数据库。每个工具都有明确的输入输出规范，AI 知道该传什么参数。

02

Resources（资源）

让 AI 能够获取信息：文件内容、数据库记录、API 响应。Resources 是只读的，为 AI 提供上下文，而不执行副作用操作。

03

Prompts（提示模板）

预定义的提示词模板，包含特定任务的指令和上下文。让复杂任务可以被标准化复用，不需要每次重新构造提示词。

三种原语覆盖了 AI 与外部世界交互的所有核心模式：做、看、学。

—— MCP 设计哲学

MCP · 核心能力

Act III · Primitives

第三阶段 · MCP

13 / 29

Anthropic · 2024.11

MCP = AI 的 USB 接口

就像 USB 统一了所有外设的连接方式，MCP 统一了 AI 模型与外部工具的连接方式。实现一次 MCP Server，任何支持 MCP 的 AI 都能用。N×M 的集成问题变成了 N+M。

OpenAI

2025

正式支持 MCP

Google

2025

Gemini 接入 MCP

Microsoft

2025

VS Code 原生支持

Governance

LF

Linux Foundation 接管

MCP · 开放标准

Act III · MCP

第三阶段 · MCP 生态

14 / 29

2026.02 · 月下载量

9700 万次

MCP SDK 月下载量，标志着 MCP 从一家公司的技术方案成为行业基础设施。

MCP · 行业基础设施

Act III · Stats

第四阶段 · Phase IV

Act IV · 15 / 29

Phase IV · 2025

Skills

技能系统 · 能力的封装与复用

第四阶段

— · —

第四阶段 · Skills

16 / 29

Progressive Disclosure · 渐进式披露

操作手册：
什么时候用什么、怎么用

USB

MCP 是接口

MCP 是 USB 接口，工具是基于接口的设备

Skill

Skill 是手册

技能是基于设备的操作手册，告诉 AI 怎么用

26+

平台采纳

Microsoft、OpenAI、Cursor、GitHub、Gemini CLI 等

Agent Skill 是一个结构化的自包含包，AI agent 可以在任务落在该技能范围内时动态加载它

—— Anthropic · agentskills.io · 2025.12

技能系统 · 定义

Act IV · Skills

第四阶段 · Skill 结构解剖

17 / 29

Anatomy · 结构解剖

一个 Skill 包含什么

Skill 是一个结构化的自包含包，当任务落在该技能范围内时，AI 会动态加载它。一个完整的 Skill 包含四个核心组成部分：

A.

触发条件

什么样的任务应该激活这个 Skill？通过关键词、任务类型、上下文特征来匹配。

B.

知识注入

Skill 被激活后，自动注入相关的领域知识、最佳实践、参考示例。不需要在提示词里预先写入。

C.

执行步骤

按什么顺序调用哪些 MCP 工具？每一步的输入输出是什么？遇到异常如何处理？

D.

输出模板

最终交付物的格式和标准。代码类 Skill 输出代码+测试，分析类 Skill 输出报告+建议。

Agent Skill 是一个结构化的自包含包，AI agent 可以在任务落在该技能范围内时动态加载它。

—— Anthropic · agentskills.io · 2025.12

Skill · 结构

Act IV · Anatomy

第四阶段 · 平台采纳

18 / 29

Adoption · 26+ 平台采纳

谁在用 Skills

从 Anthropic 发布 agentskills.io 标准开始，Skills 已经被 26+ 主流 AI 平台采纳。这个数字还在快速增长。

Anthropic

Claude Code · Skills 原创

Microsoft

VS Code · GitHub Copilot

OpenAI

ChatGPT · Codex

Google

Gemini CLI · Jules

Skills 标准正在成为 AI 工具生态的通用能力描述语言。

—— 2025.12 · agentskills.io 发布

Skills · 平台生态

Act IV · Ecosystem

第五阶段 · Phase V

Act V · 19 / 29

Phase V · 2026

Harness
Engineering

驾驭工程 · 让 AI 可靠运行的新学科

第五阶段

— · —

第五阶段 · 驾驭工程

20 / 29

Ryan Lopopolo · OpenAI · 2026.02

每当 AI agent 犯一个错误，工程师应该构建一个解决方案，确保这个 agent 永远不再犯这个特定的错误。

Agent = Model + Harness

—— LangChain · 公式

光有大模型不够，必须有"驾驭层"来管理 AI 的整个执行生命周期——人机交互、子 Agent 管理、文件系统访问、Prompt 预设、生命周期钩子、任务规划。Model 是能力，Harness 是可靠性。

驾驭工程 · 核心理念

Act V · HE

第五阶段 · 三层驾驭架构

21 / 29

Three-layer Harness Architecture

三层驾驭架构

01

约束 Harness

在错误发生之前就阻止它。通过规则检查操作是否合规，防止 AI 绕过关卡而不真正修复问题。

02

反馈循环

错误发生之后让 AI 有能力自我修正。系统检测异常后，自动把错误上下文返回给 AI，让它重新推理。

03

质量门

AI 完成任务后、代码被合并之前，进行全面合规性检查。传统 CI 不足以应对 AI 生成代码的特殊问题。

驾驭工程 · 三层架构

Act V · Architecture

第五阶段 · 案例研究

22 / 29

Best Practice · 最佳案例

Claude Code：
Harness 的最佳样本

权限

权限模型默认只读

任何文件修改都需要用户显式批准

快照

自动快照

每次修改前自动保存，出了任何问题都可以一键回滚

钩子

Hooks 系统

在关键节点注入安全扫描、linting、合规性检查

上下文

CLAUDE.md

给 AI 持久化的项目上下文

AI 有能力，但能力的边界被明确划定。

案例 · Claude Code

Act V · Case

第五阶段 · 行业案例

23 / 29

Who's Rewriting Harness

谁在重写 Harness

Manus

6 个月重写 Harness 5 次。每次重写都源于一个具体失败案例——某个场景下 AI 行为失控，团队不是打补丁，而是从根本上重新设计 Harness 的约束机制。

5 次

LangChain

一年内对 Open Deep Research 重构 4 次。Harness 是一个需要持续迭代的工程对象，不是一次性设计好的静态系统。

4 次

Vercel

移除了 agent 80% 的工具，反而获得了更少步骤、更少 token、更快响应。Harness 设计的核心不是"让 AI 能做更多"，而是"让 AI 在关键事情上更可靠"。

精简

行业案例

Act V · Cases

深层逻辑 · Deep Logic

Deep Logic · 24 / 29

Beyond the Five Phases

深层逻辑

为什么技术按照这个顺序演进？

深层逻辑

— · —

深层逻辑 · 演进因果链

25 / 29

The Logic · 因果链

每个阶段都解决了
上一阶段的根本局限

五次演进不是随机发生的，而是沿着一条严密的因果链：

PE→CE

提示词工程撞上了上下文墙——AI 能力再强，看不到项目上下文也白搭。于是从"怎么问"升级为"给什么信息环境"。

信息

CE→MCP

上下文工程解决了信息问题，但工具接入是碎片化的——每接一个新工具就要写一套定制代码。于是需要标准协议统一工具连接。

连接

MCP→Skills

有了标准接口，工具可以接了，但 AI 不知道什么时候该用什么工具。于是需要"操作手册"来指导 AI 在正确时机使用正确工具。

运用

Skills→HE

AI 有了工具、知道怎么用，但它会犯错。一个不可靠的 Agent 比没有 Agent 更危险。于是需要"驾驭层"来确保可靠运行。

可靠

能力 → 信息 → 连接 → 运用 → 可靠——这是 AI 编程技术走向成熟的必经之路。

演进逻辑 · 因果链

Deep Logic

实践意义 · For Engineers

26 / 29

What It Means · 现实指导

对工程师意味着什么

PE

学会与 AI 对话

CoT、Few-shot、Role Prompting 仍然是日常最常用的技巧。它们是所有高级技术的基础。

CE

构建信息环境

不要只关注提示词怎么写，要关注为 AI 构建什么样的信息环境：知识库、记忆系统、持久化规则。

HE

设计可靠系统

不要只追求 AI 能做什么，要设计让 AI 不犯错的系统：约束、反馈循环、质量门禁。可靠性才是生产力的保障。

掌握底层逻辑，比追逐具体工具更重要。工具会变，逻辑不变。

实践意义

For Engineers

完整技术演进时间线

27 / 29

Evolution Timeline · 2017 — 2026

2017

Transformer 架构发布 · PE 技术基础

—

2020

GPT-3 发布 · 第一阶段：PE

PE

2021

GitHub Copilot 发布 · 上下文瓶颈首次暴露

—

2022

ChatGPT 发布，PE 普及 · 第一阶段全盛

PE

2023-24

Cursor / Claude Code / Windsurf 崛起 · CE 系统化

CE

2024.11

Anthropic 发布 MCP · 第三阶段：MCP

MCP

2025.10

Anthropic 发布 Agent Skills · 第四阶段：Skills

Skills

2026.02

Harness Engineering 正式定义 · 第五阶段：HE

HE

技术演进 · 时间线

— · —

核心收获 · Takeaways

30 / 31

The Takeaway · 五个核心收获

五个关键认知

01

技术从"怎么说"进化到"给什么"再到"怎么保证"——每一层都在解决上一层的根本局限。

02

每个阶段是叠加而非替代——PE 仍然是基础，CE 是增强，MCP 是标准化，Skills 是封装，HE 是保障。

03

标准接口击败定制集成——MCP 证明了统一协议的价值，N×M 变成了 N+M。

04

能力不可靠就是危险——一个会犯错但看起来对的 Agent，比一个不会做事的 Agent 更可怕。

05

未来属于能驾驭 AI 的人——不是最会写提示词的人，而是最懂得构建信息环境、设计可靠系统的人。

核心收获

Takeaways

结语 · Closing

31 / 31

The Takeaway

掌握逻辑，
比追逐工具更重要

技术的发展永远比任何文章都快，但底层逻辑变化很慢。理解了从提示词到驾驭工程的五次演进，你就拥有了判断任何新工具的坐标系。

从提示词到驾驭工程·2026

从提示词到驾驭工程

— 2026 —

AI 编程的五次演进

PromptEngineering

GPT-3 · 上下文学习的诞生

提示词工程的三大局限

上下文窗口的约束

ContextEngineering

问题不只是"怎么问"，而是"给 AI 什么信息环境"

"Vibe Coding"

MCP

MCP 之前：每接一个工具，写一套代码

MCP 的架构设计

Tools · Resources · Prompts

MCP = AI 的 USB 接口

Skills

操作手册：什么时候用什么、怎么用

一个 Skill 包含什么

谁在用 Skills

HarnessEngineering

三层驾驭架构

Claude Code：Harness 的最佳样本

谁在重写 Harness

深层逻辑

每个阶段都解决了上一阶段的根本局限

对工程师意味着什么

五个关键认知

掌握逻辑，比追逐工具更重要

AI 编程的
五次演进

Prompt
Engineering

提示词工程的
三大局限

上下文窗口
的约束

Context
Engineering

问题不只是"怎么问"，
而是"给 AI 什么信息环境"

MCP 之前：
每接一个工具，写一套代码

操作手册：
什么时候用什么、怎么用

Harness
Engineering

Claude Code：
Harness 的最佳样本

每个阶段都解决了
上一阶段的根本局限

掌握逻辑，
比追逐工具更重要