超大量更新
This commit is contained in:
175
98-AgentSkills指南/2026年3月31日-开发工具对比.md
Normal file
175
98-AgentSkills指南/2026年3月31日-开发工具对比.md
Normal file
@@ -0,0 +1,175 @@
|
||||
# 主流AI编程工具对比
|
||||
|
||||
综合对比目前(2026 年 3 月左右)主流 20 美元档工具:**从“能持续帮你写代码/跑 Agent 的总时长”和体感流畅度看,性价比大致是:Cursor Pro > ChatGPT Plus(Codex)≈ Claude Pro(看重质量时偏向 Claude)> Google AI Pro(Gemini Apps + Code Assist)> AWS Kiro Pro。**
|
||||
|
||||
下面按你关心的点拆开说,重点放在 Codex vs Claude Code 的用量水平,并解释为什么你会觉得 Google 的用量已经“不能正常 Agent 编程”。
|
||||
|
||||
***
|
||||
|
||||
## 一句话概览各家 20 美元套餐
|
||||
|
||||
- **Cursor Pro(20 美元/月)**:
|
||||
无限补全 + 无限 Auto 模式,外加每月约等价 20 美元的前沿模型 Credit;只要主力是补全 + 轻中度 Agent,性价比非常高,重度长时间 Agent 会较快耗尽 Credit。
|
||||
- **ChatGPT Plus(含 Codex,20 美元/月)**:
|
||||
通用 GPT‑4/5 模型 + Codex Agent/CLI/IDE;5 小时滚动窗口内 Codex 本地消息大约 30–150 条级别,重度使用时单个窗口能支撑 1.5–2 小时高强度 Agent 编程;可以额外买 Credits 扩容。
|
||||
- **Claude Pro + Claude Code(20 美元/月)**:
|
||||
5 小时滚动窗口 + 周配额;大致 45 条 Sonnet 消息/5 小时,对应 10–40 次 Claude Code 提示/5 小时;单次深度理解/重构体验很好,但连续跑 Agent 很容易顶配额,需要 Max 5×/20× 才适合全天候 Agent。
|
||||
- **Google AI Pro(Gemini Advanced + Gemini Code Assist,约 20 美元/月)**:
|
||||
Gemini Apps 侧大致 300(Thinking)+100(Pro)条 prompt/天;Code Assist 侧 1M token 上下文 + 1500 请求/天,但一次 Agent 任务会拆成多次请求,重度 Agent 的体感“扣得很快”,所以你会觉得用量明显不够用。
|
||||
- **AWS Kiro Pro(约 20 美元/月)**:
|
||||
新版定价只有 225 vibe + 125 spec 请求/月,且额外 spec 要 0.20 美元/次;对个人重度编码者来说远远不够,整体成本会飙到远高于 20 美元档,基本不适合作为主力工具。
|
||||
|
||||
***
|
||||
|
||||
## 重点一:Codex(基于 ChatGPT Plus)的用量水平
|
||||
|
||||
**计费模型**:
|
||||
Codex 现在是 ChatGPT 付费计划里的一个“软件工程 Agent 套件”,不需要单独买 Codex 订阅:Plus/Pro/Business/Enterprise 都内含 Codex Web、CLI 和 IDE 扩展。
|
||||
|
||||
**限制大致有三层**:
|
||||
|
||||
1. **5 小时滚动窗口**
|
||||
- 官方 Codex FAQ 给的区间:Plus 用户在 5 小时时段内,大概可以发 **33–168 条 Codex 本地消息**,具体取决于模型、速度和任务复杂度。
|
||||
- 另一篇定价解析给出的量级类似:**30–150 条本地消息或 5–40 个云端 Codex 任务/5 小时**(云任务就是你在 Web 上丢给 Codex 跑 1–30 分钟的一整段 Agent 工作)。
|
||||
2. **周配额**
|
||||
- OpenAI 没公开精确数字,但实践中不少人冲刺几天后会出现“多天冷却期”提示,需要等周配额刷新或额外买 Credits。
|
||||
3. **模型/速度权重**
|
||||
- 用越贵的模型(例如更高版本 GPT‑5 Codex)或开更高速度,单消息消耗的 Credit 越大,同样 5 小时窗口可用的“条数”就越少。
|
||||
|
||||
**体感可以坚持多久?**
|
||||
|
||||
根据 CLI 订阅解析和用户反馈:
|
||||
|
||||
- 如果你持续、高频地让 Codex 重构、跑测试、多文件修改,**一个 5 小时窗口里大概能有 1.5–2 小时的“全程高强度 Codex 时间”**,之后就会被限流到下个时间窗。
|
||||
- 合理拆分成上午/下午/晚上几个高强度时段,一天里 Codex 能“认真帮你干活”的时间大致 3–5 小时;如果天天这么干,周配额有机会被打满。
|
||||
- 对“中度使用”(大量补全 + 少量重型 Agent),Plus 的 Codex 容量通常够用,同时还能拿 ChatGPT 做文档、解释、调试分析等通用任务,这一块性价比相对 Claude Pro 略占优。
|
||||
|
||||
***
|
||||
|
||||
## 重点二:Claude Code(基于 Claude Pro)的用量水平
|
||||
|
||||
**统一用量桶**:
|
||||
Claude Pro 20 美元/月,年付折算约 17 美元;Claude Web 与 Claude Code 共用同一个 Pro 用量桶(5 小时滚动窗口 + 周配额)。
|
||||
|
||||
**总体消息容量**:
|
||||
|
||||
- 官方 usage 文章:若对话不太长、文件也不是特别大,**Pro 用户 5 小时里大概能发 45 条 Sonnet 消息**,比免费版大约多 5 倍。
|
||||
- 按照 5 小时滚动窗口换算,一天分散使用可以达到 **200–216 条短消息**,前提是你不是一直扔巨型 PDF 和长对话。
|
||||
- Pro 的总量大约是 Free 的 5 倍;再往上是 Max 5×(100 美元)和 Max 20×(200 美元),分别在容量上乘 5 和乘 20,用于重度工程/Agent 场景。
|
||||
|
||||
**Claude Code 专用的经验配额**:
|
||||
|
||||
- Anthropic 的说明和 issues 里都强调,**Claude Code 的提示数量比纯聊天少得多**:Pro 级别在 5 小时里大致 **10–40 次 Claude Code 提示**,仓库越大、终端和自动接受用得越多,能用的提示越少。
|
||||
- 社区制作的 usage 计数器和经验贴普遍说法是:**中大型项目里连续“认真干活”1.5–2 小时,就会摸到 5 小时上限**,尤其你让 Claude Code 不断自动应用补丁、多次遍历仓库时。
|
||||
|
||||
**短促促销不改变长期结构**:
|
||||
2026 年 3 月确实有一个“非高峰时段翻倍用量”的促销活动(Free/Pro/Max 都翻倍),但只持续到 3 月下旬,对“长期 20 美元性价比”不能当作常态指标。
|
||||
|
||||
***
|
||||
|
||||
## Codex vs Claude Code:谁更值 20 美元?
|
||||
|
||||
站在你这种“Agent 编程 + 整仓重构”的开发者视角,可以用三个维度看:**纯容量、体验质量、扩容路径。**
|
||||
|
||||
### 1. 纯容量与可持续时长
|
||||
|
||||
并列比较(都是 20 美元级):
|
||||
|
||||
- **Codex / ChatGPT Plus**
|
||||
- 5 小时里约 30–150 条 Codex 本地消息(具体看复杂度)。
|
||||
- 高强度 Agent 使用约 1.5–2 小时就会触顶一个窗口,但一天拆成几段可以拿到 3–5 小时高强度协作时间。
|
||||
- **Claude Code / Claude Pro**
|
||||
- 5 小时里约 10–40 次 Claude Code 提示,外加大约 45 条普通 Sonnet 消息。
|
||||
- 中重度 Agent 使用下,同样 1.5–2 小时左右就会被卡住,但因为 Code 提示本身更“贵”,你会更快体感到紧张。
|
||||
|
||||
换算下来:
|
||||
**在相同 20 美元价位上,Codex 整体可用的“提示数”和高强度可持续时长,略优于 Claude Code**——尤其当你并不是把全部额度都拿来跑重型 Agent,而是混合 Chat、解释、文档生成时,这个差距会更明显。
|
||||
|
||||
### 2. 交互/推理体验质量
|
||||
|
||||
- **Claude Code** 在理解长代码、给重构建议、自然语言解释设计决策等方面口碑非常好,很多人拿它做“虚拟架构师”。
|
||||
- **Codex** 依托 GPT‑5.x/4.x,在实现能力和联想能力上也不弱,但整体偏“执行很猛”,尤其适合具体实现和迭代,而不是系统性长文档讨论(当然它也能做,只是风格不同)。
|
||||
|
||||
如果你经常让模型帮你“想设计 + 给路线 + 再自己实现”,Claude Code 会让你感觉“单次价值高”;
|
||||
如果你更希望模型**多跑几次、不断试错/迭代**,Codex 的容量会显得更友好。
|
||||
|
||||
### 3. 扩容路径与成本
|
||||
|
||||
- **Codex**:可以在 Plus 基础上单独购买额外 ChatGPT/Codex Credits,或者升级到 Pro 200 美元/月;也可以在 IDE 里切到 API Key,直接按 token 计费,这样不吃 Plus 配额。
|
||||
- **Claude Code**:当前主要是升级到 Max 5×/20× 或转到 Claude API;等级跃迁是 20→100→200 美元,缺少中间小步扩容,对个人开发者会比较痛。
|
||||
|
||||
**结论**:
|
||||
|
||||
- 如果你核心诉求是“**尽可能多地跑 Agent/多迭代几轮**”,在 20 美元档里,**Codex(ChatGPT Plus)比 Claude Code 更抗造一点**。
|
||||
- 如果你更在意“**每次对话质量、解释深度、架构建议质量**”,可以接受每天只用 Claude Code 解决 1–2 个关键问题,那么 Claude Pro 仍然非常有价值。
|
||||
|
||||
***
|
||||
|
||||
## Google:为什么你体感“已经没法 Agent 编程”
|
||||
|
||||
Google 这边要分两套看:**Gemini Apps(网页/移动)** 与 **Gemini Code Assist(IDE/CLI)**。
|
||||
|
||||
### Gemini Apps / AI Pro
|
||||
|
||||
- 早期官方写法:AI Pro 订阅每天约 **100 条 Pro 模型 prompts**,免费用户每天只有 5 条 Pro prompt,Context 32K vs 1M。
|
||||
- 2026 年 1 月起,Google 调整 Gemini 3 的限额为**分模型计数**:
|
||||
- AI Pro:**300 条 Thinking prompts/天 + 100 条 Pro prompts/天**。
|
||||
- Ultra:1500 + 500 条/天。
|
||||
|
||||
对**普通聊天/问答**来说,这个量已经不算少;
|
||||
但对**Agent 编程**来说,一次复杂任务常常要十几二十轮交互,而且你还会顺手拿它查文档、改提示、生成说明书……于是**很容易在一天中段就冲到 300+100 的上限**,体感自然是“完全不够用”。
|
||||
|
||||
### Gemini Code Assist / Code Agent
|
||||
|
||||
Code Assist 官方配额:
|
||||
|
||||
- **上下文窗口**:本地代码感知最长可达 **1,000,000 token**,这一点确实在“整仓理解”上很强。
|
||||
- **日请求数**:
|
||||
- 通过 Google AI Pro 使用 Code Assist:**1500 次请求/用户/天**。
|
||||
- 免费个人版:1000 次/天;Enterprise:2000 次/天。
|
||||
|
||||
问题在于:
|
||||
官方文档明确说,**Agent 模式 或 Gemini CLI 下,一个高级任务会被拆成多次底层请求**——比如你只点了一次“修这个包”,后台可能发出几十到上百次接口调用;**所以 1500 次请求对重度 Agent 来说,远没有纸面上看起来那么宽裕。**
|
||||
|
||||
结合你的感受,可以合理推断:
|
||||
|
||||
- 你如果主要用 **Apps(网页端)+ Pro 模型** 跑 Agent,日常经常撞 100 或 300+100 上限,自然觉得“不能用来做严肃代码”。
|
||||
- 即便切到 Code Assist,**1500 请求/天** 在复杂 Agent 链路下也会被快速吃光,尤其你连续多天冲刺时,所以整体体验明显不如当初刚出 Gemini 2.x 时宽松。
|
||||
|
||||
***
|
||||
|
||||
## Cursor 与 Kiro:两端极端的例子
|
||||
|
||||
### Cursor Pro:20 美元档相对最划算的“写码主场”
|
||||
|
||||
- 无限补全 + 无限 Auto 模式,不吃 Credit,是 Cursor 性价比的核心。
|
||||
- 每月 20 美元的高级模型 Credit,哪怕被几次大型 Agent 用完,你的**基础补全和轻量 Chat 仍然是无限可用**,不会像 Claude/Google 一样整套功能被硬性卡住。
|
||||
- 只要你把真正极重的任务分摊到 Codex/Claude/Gemini,而让 Cursor 主打补全 + 中小型重构,它在 20 美元档的“日常可用时间”几乎是最好的。
|
||||
|
||||
|
||||
### AWS Kiro Pro:价格结构基本劝退个人
|
||||
|
||||
- 新版定价:Pro 20 美元/月只给 **225 vibe + 125 spec 请求**,多一条 spec 要 0.20 美元;对照一些开发者的测算,哪怕只是“轻度编码”,每月也要 3000 spec 左右,成本一下子涨到 500 多美元/月,全职编码甚至预估近 2000 美元/月。
|
||||
- 和 Cursor / ChatGPT Plus / Claude Pro / Google AI Pro 的“约 20 美元 = 至少每天几小时可用”逻辑完全不同;对个人来说几乎没法当主力,只适合 AWS 赞助/公司买单的小众用途。
|
||||
|
||||
***
|
||||
|
||||
## 实际订阅组合建议(针对你这种重度 Agent 用户)
|
||||
|
||||
结合上面这些定量和定性信息,你可以考虑把 20 美元档的预算这样分配和使用:
|
||||
|
||||
1. **把 Cursor Pro 当主力 IDE**
|
||||
- 日常所有“写实现、补全、局部重构”都尽量走 Cursor 的无限补全 + Auto 模式,保证每天核心工作不被配额卡死。
|
||||
- 只在需要“全仓分析/大迁移/特别难的 Bug”时,才切成手工选用最强模型,让月度 20 美元 Credit 用在刀刃上。
|
||||
2. **ChatGPT Plus(Codex)当“高强度 Agent + 通用大脑”**
|
||||
- 把真正需要多轮 Agent 推进的重型场景(复杂 refactor、设计对比、多语言混合项目)交给 Codex 做主攻,利用它在 5 小时窗口里相对更宽松的提示数。
|
||||
- 特别是需要“写文档 + 写脚本 + 写代码”一体化的任务时,让 Codex 完整链路负责,Cursor 用来做本地执行和微调。
|
||||
3. **Claude Pro 作为“高价值、低频”专家**
|
||||
- 把 Claude Code 用在关键节点:看架构、审 PR、给重构路线、帮你读晦涩业务逻辑;用 10–40 次 Code 提示/5 小时换来几次 **极高质量的建议**,而不是当流水线码农用。
|
||||
4. **Google AI Pro / Gemini Code Assist 只在你必须深度用 Google 生态时保留**
|
||||
- 如果你的仓库在 GCP / Cloud Source / BigQuery 等环境里,1M 上下文 + 1500 请求/天还是有价值的,只是要心理预期:它不是无限 Agent 工厂,而是“大仓库理解 + 关键改动”的专用工具。
|
||||
- 如果只是偶尔用 Gemini 查资料或写点文案,性价比明显不如把这 20 美元挪去加强 Codex / Claude / Cursor。
|
||||
5. **明确把 Kiro 排除在“个人主力工具”之外**
|
||||
- 在当前定价下,你几乎不可能以 20 美元的成本获得足够多的 Kiro 任务配额,让它作为日常 Agent 工作台;可以当 AWS 生态里的 demo 工具,别指望它扛起整月工作量。
|
||||
|
||||
***
|
||||
Reference in New Issue
Block a user