深色模式
AI 编程工具对比
概述
Claude Code、Cursor、Codex、Antigravity 表面上很像。它们都支持规则文件、MCP、工具调用、项目记忆,也都能读代码、改代码、跑任务。
真正的差别,不在有没有这些能力,而在工作流中心放在哪里。Claude Code 把终端放在前面,Cursor 把 IDE 放在前面,Codex 更强调统一配置链,Antigravity 则把任务编排和产物验证放在前面。看清这一点,比单纯比功能表更有用。
结论
这四个工具本质上都在做同一件事:把大模型从“会聊天的助手”推进成“能进入真实开发环境、读取项目约束、调用外部系统并完成任务的 agent”。
如果用一句话概括它们的主战场:
| 工具 | 更像什么 | 工作流中心 | 可复用能力的主要形态 | MCP 的位置 |
|---|---|---|---|---|
| Claude Code | 终端里的 agent 操作台 | Shell、仓库、任务拆解 | CLAUDE.md、SKILL.md、subagents、plugins | 原生主轴,和 skills、plugins 结合很深 |
| Cursor | IDE 里的 agent 平台 | 编辑器、聊天面板、Cloud Agents | Rules、Skills、AGENTS.md、Commands | 原生主轴,且与 IDE、Cloud Agents 深度整合 |
| Codex | OpenAI 体系下的终端 + IDE coding agent | CLI、IDE extension、配置链 | AGENTS.md、config.toml、MCP、subagents | 原生支持,但表达方式更偏配置与会话控制 |
| Antigravity | agent-first 的开发平台 | Manager Surface、异步代理、Artifacts | knowledge base、任务产物、平台内 agent 记忆 | 公开资料显示生态明显拥抱 MCP,但主叙事更偏 agent 编排与验证 |
四者不是简单替代关系,而是同一代 AI 开发栈的四种前端。
它们相通在哪里
如果站在工具设计层去看,这四个产品共享的是同一套能力模型。一个成熟的 AI 开发工具,通常都需要解决下面五层问题。
第一层是上下文层。模型默认并不记得你的仓库,也不理解你的团队约束,所以需要一个长期存在的入口把项目背景、目录结构、命令约定和禁区灌进去。Claude Code 用 CLAUDE.md,Codex 用 AGENTS.md,Cursor 同时支持 Rules 和 AGENTS.md,Antigravity 的公开表述则更偏向可持续积累的 knowledge base。
第二层是能力层。模型不只是读文本,还要会调用终端、浏览器、设计稿、数据库、工单系统和文档系统。这里四者都在走向同一个方向:让 agent 不再困在纯文本对话里,而是进入真正的工具环境。
第三层是工作流层。不是每个任务都适合“问一句,回一句”。复杂任务需要拆解、并行、验证、恢复上下文,甚至需要异步跑很久。Claude Code 有 subagents 和面向任务的 skills,Cursor 有本地 Agent 和 Cloud Agents,Codex 也把 CLI、IDE 和 Cloud task 连接起来,Antigravity 则把多 agent 编排直接做成核心界面。
第四层是约束层。工具不仅要“能做”,还要“按你的方式做”。因此 Rules、Skills、AGENTS.md、权限控制、工具白名单、审批机制,都是这类产品的核心,而不是边角功能。
第五层是验证层。AI 真正进入生产工作流之后,最重要的问题不是“它会不会写”,而是“你如何信任它写的东西”。Claude Code、Cursor、Codex 都在往更细的工具调用可见性、权限审批、会话控制上走;Antigravity 则更进一步,把 Artifacts 作为主要反馈界面,用截图、录像、计划和中间产物代替原始日志。
从这个角度看,四者的相通点远多于表面上的品牌差异。
比较重点
老手在意的通常不是“哪家能生成代码”,而是下面这些问题:
- 我怎样把自己的工作习惯沉淀进去,而不是每次重讲一遍。
- 我怎样把外部系统接进来,让 agent 直接拿到数据库、工单、浏览器、设计稿和线上信息。
- 我怎样控制它改动的边界,避免它一上来把整个仓库搅乱。
- 我怎样在同步编辑、异步执行、并行代理之间切换。
- 我怎样在结果可见、可验证、可复盘的前提下,把更多任务交给它。
Claude Code、Cursor、Codex、Antigravity 的差别,基本都落在这几件事上。
Skills、规则与项目记忆
表面上看,它们都支持长期记忆和可复用工作流。差别主要在表达方式。
Claude Code:把 skills 做成一等能力
Claude Code 的分层比较清楚。CLAUDE.md 负责项目背景,SKILL.md 负责可复用工作流。skills 可以自动触发,也可以手动调用,还能带 supporting files、脚本、模板、工具权限和子代理执行方式。
在 Claude Code 里,CLAUDE.md 解决“项目是什么、怎么做事”,skills 解决“某类任务按什么流程跑”。对终端重度用户,这种分层很顺手。
Claude Code 的 plugins 还能把 skills、agents、hooks、MCP servers 打包在一起,扩展面做得比较完整。
Cursor:Rules 和 Skills 并存,更偏 IDE 工作流
Cursor 的思路和 Claude Code 很接近,但它明显更贴近 IDE 心智。
它把短约束放进 Rules,把长流程放进 Skills。Rules 更像系统级指导,支持 .cursor/rules、用户规则、团队规则,以及 AGENTS.md。Skills 则是面向多步骤流程的复用单元,支持 /create-skill 创建,也能通过 /skill-name 或 @skill-name 调用。
一个值得注意的细节是,Cursor 不只支持自己的 .cursor/skills/,还兼容 .claude/skills/、.codex/skills/ 这类目录。跨工具迁移和复用,已经在产品层面被默认接受了。
多工具用户切到 Cursor 时,通常不会觉得这套东西太陌生。
Codex:更偏 AGENTS.md + 配置链,而不是把 skills 单独抬出来
Codex 也支持长期指导和可扩展能力,但它的表达方式更偏 OpenAI 风格的配置链。
官方公开资料里,Codex 把 AGENTS.md 放在很重要的位置,并且支持从全局目录到项目目录再到子目录的分层发现与覆盖。再加上 config.toml、CLI/TUI、IDE extension、approval mode、subagents,这套体系非常完整。
和 Claude Code、Cursor 相比,Codex 当前更突出的不是把 skills 做成一等原语,而是把项目指导、MCP、会话配置和代理执行组合成一条统一工作流。套路当然也能沉淀,只是形态更偏 AGENTS.md、配置项和工具集成。
对于同时使用多家工具的人,这一点很重要:在 Codex 里,你关注的不是“有没有 skills 按钮”,而是“我能否把指导、工具和执行链组织成一套稳定模式”。答案是可以,只是形态不同。
Antigravity:公开叙事更偏知识沉淀与 agent 编排
从公开资料看,Antigravity 没把 skills 这个文件系统级原语摆在前台,而是把“学习”和“任务产物”做成平台能力。
它强调 agents 把有用的上下文和代码片段保存进 knowledge base,也强调 Manager Surface、Artifacts、异步多 agent 和跨 editor、terminal、browser 的端到端执行。经验沉淀更多发生在平台层,而不是一堆手工维护的规则文件里。
用惯了 Claude Code 或 Cursor,再看 Antigravity,最需要切换的是视角。它更像一个任务平台,不只是会写代码的聊天框。
MCP 的位置
如果说项目规则解决的是“让模型知道该怎么做”,那么 MCP 解决的就是“让模型真的有东西可用”。
这四个工具都在拥抱 MCP,但拥抱的方式不完全一样。
Claude Code:MCP 已经进入主工作流
Claude Code 对 MCP 的支持非常深。它不仅原生支持本地 stdio、远程 HTTP、SSE 等方式接入 MCP server,还把 MCP 和 plugins、channels、skills 放在同一套 agent 体系里。
在 Claude Code 里,MCP 不是“给聊天框加几个外部接口”,而是 agent 的能力扩展层。接工单、查监控、读数据库、拉设计稿、监听外部事件,都能自然进入任务链路。
Claude Code 的强项,不只是“支持 MCP”,而是 MCP 接进来以后能直接进入任务执行流。
Cursor:MCP 深度绑定 IDE 和 Cloud Agents
Cursor 对 MCP 的支持同样成熟,而且它的一个优势是把 MCP 直接放进 IDE 和 Cloud Agents 这两个场景。
本地聊天面板里,Agent 可以直接使用 MCP tools;Cloud Agents 也能在隔离环境里继续使用这些外部能力。官方文档还明确列出了对 Tools、Prompts、Resources、Roots、Elicitation 以及 MCP Apps 的支持,这比很多“只支持调 tool” 的集成更完整。
Cursor 的 MCP 更适合两件事:一是在 IDE 里快速把外部上下文带进当前编辑任务,二是在异步云代理里把外部系统整合进长任务执行链。
Codex:MCP 是统一 CLI 与 IDE 的扩展接口
Codex 的特点在于,CLI 和 IDE extension 共用同一套 MCP 配置。你在 config.toml 或 .codex/config.toml 里配好的 server,可以同时服务终端和 IDE。
这个设计看起来朴素,但很实用:终端和 IDE 不需要维护两套 MCP 体系。工作主线一旦围绕 Codex 的配置链建立起来,这层能力就能在两个入口之间共享。
Codex 的 MCP 更像一层稳定基础设施,而不是 UI 功能点。
Antigravity:更强调 agent-first 平台与可验证执行
截至目前公开资料,Antigravity 的官方叙事重点仍然是 editor + manager surface + artifacts + 多 agent 编排,而不是像 Claude Code、Cursor、Codex 一样,把用户级 MCP 配置细节讲得很展开。
但它所处的 Google 生态正在明显拥抱 MCP,例如官方已经推出了面向开发文档和公共数据的 MCP server。把这些信号放在一起看,Antigravity 的方向很清楚:它不是排斥 MCP,而是把 MCP 看成更大 agent 平台中的一个接入面。
在 Antigravity 身上,MCP 更像平台能力的一部分,不是用户感知最强的主角。用户更先看到的是 agent 如何跨 editor、terminal、browser 连续工作,以及如何通过 Artifacts 汇报结果。
工作流中心
同样支持规则、skills、MCP 和工具调用,为什么四者用起来还是很不一样?因为它们的工作流中心不同。
Claude Code 的中心是终端会话。你会很自然地把它当作一个进入仓库、读规则、调工具、拆任务、跑命令的 agent 操作台。它适合那些已经习惯 shell、git、脚本和命令式工作流的人。
Cursor 的中心是IDE 协作。它的很多能力不是孤立存在,而是和编辑器上下文、文件选择、Rules、MCP、Cloud Agents 串在一起。你在 Cursor 里会更频繁地体验到“边看代码边调 agent”的连续感。
Codex 的中心是统一的 agent 配置链。它既能在 CLI 里跑,也能在 IDE extension 里跑,还能共享 AGENTS.md 和 MCP 配置。这种设计对希望在不同入口下保持同一套操作习惯的人很有吸引力。
Antigravity 的中心是任务编排与验证。你不是主要围着会话转,而是围着任务、agent、Artifacts、Manager Surface 转。它适合那些希望把 AI 从“协助写代码”进一步升级成“并行推进任务系统”的用户。
这也是为什么成熟用户往往不会只用其中一个工具。
共同底层
如果同时使用这四个工具,更有用的做法不是把它们看成互斥竞品,而是看成四种不同的 agent 交互壳。
它们共享的底层原语大致一样:
- 用规则文件或长期记忆,让模型持续理解项目。
- 用
skills、命令、模板或知识库,让经验变成可复用流程。 - 用 MCP 把数据库、文档、设计稿、浏览器、工单和线上系统接进来。
- 用审批、权限和验证产物控制风险。
- 用多 agent、云代理或异步任务放大吞吐量。
放进同一个框架里以后,很多“功能对比”就不那么重要了。更重要的是:当前这一步,该用哪个外壳更顺手。
分工建议
按工作段来分工,大致可以这样看:
- Claude Code 适合做“仓库内、终端驱动、步骤清晰”的重执行任务,尤其适合把规则、skills、MCP 和 shell 命令组合成稳定流程。
- Cursor 适合做“IDE 内持续协作”的主力环境,特别适合边编辑边调用外部上下文,或者把本地工作切到 Cloud Agents 做异步延伸。
- Codex 适合那些希望在 OpenAI 生态里同时拥有 CLI 和 IDE 两个入口、并保持同一套
AGENTS.md与 MCP 配置的人。 - Antigravity 适合把 agent 当成真正的后台执行者来管理,尤其是需要多 agent 并行、浏览器验证和基于 Artifacts 审核结果的时候。
四者不是谁覆盖谁,而是谁在不同工作段里更顺手。
什么时候该切换,什么时候该组合
常见误区是总想选一个“唯一主力工具”。进入多 agent 开发阶段以后,组合使用通常更现实。
例如,你可以在 Cursor 里完成日常编辑和局部协作,把复杂终端任务交给 Claude Code,把需要统一 OpenAI 工作流的仓库交给 Codex,把长时间后台推进、需要多代理和可视化验证的任务放进 Antigravity。
这时你的判断标准就不再是“谁功能更多”,而是:
- 当前任务更依赖终端、IDE、还是异步编排。
- 你更需要严格控制步骤,还是更需要平台帮你组织任务。
- 你需要的是即时对话产出,还是可审核的中间产物。
- 你的团队已经把规则和工具链沉淀在哪一套体系里。
按这个方式去看,四个工具之间的关系会清楚很多:Claude Code 偏终端执行,Cursor 偏 IDE 协作,Codex 偏统一配置链,Antigravity 偏任务编排。选型时先看当前任务需要什么外壳,再看哪个 agent 上场。
