超大量更新

2026-04-29 09:46:36 +08:00
parent ed945abdf1
commit e7c301023c
349 changed files with 83923 additions and 560 deletions
--- a/98-AgentSkills指南/2026年3月31日-开发工具对比.md
+++ b/98-AgentSkills指南/2026年3月31日-开发工具对比.md
@@ -0,0 +1,175 @@
+# 主流AI编程工具对比
+
+综合对比目前（2026 年 3 月左右）主流 20 美元档工具：**从“能持续帮你写代码/跑 Agent 的总时长”和体感流畅度看，性价比大致是：Cursor Pro > ChatGPT Plus（Codex）≈ Claude Pro（看重质量时偏向 Claude）> Google AI Pro（Gemini Apps + Code Assist）> AWS Kiro Pro。**
+
+下面按你关心的点拆开说，重点放在 Codex vs Claude Code 的用量水平，并解释为什么你会觉得 Google 的用量已经“不能正常 Agent 编程”。
+
+***
+
+## 一句话概览各家 20 美元套餐
+
+- **Cursor Pro（20 美元/月）**：
+  无限补全 + 无限 Auto 模式，外加每月约等价 20 美元的前沿模型 Credit；只要主力是补全 + 轻中度 Agent，性价比非常高，重度长时间 Agent 会较快耗尽 Credit。
+- **ChatGPT Plus（含 Codex，20 美元/月）**：
+  通用 GPT‑4/5 模型 + Codex Agent/CLI/IDE；5 小时滚动窗口内 Codex 本地消息大约 30–150 条级别，重度使用时单个窗口能支撑 1.5–2 小时高强度 Agent 编程；可以额外买 Credits 扩容。
+- **Claude Pro + Claude Code（20 美元/月）**：
+  5 小时滚动窗口 + 周配额；大致 45 条 Sonnet 消息/5 小时，对应 10–40 次 Claude Code 提示/5 小时；单次深度理解/重构体验很好，但连续跑 Agent 很容易顶配额，需要 Max 5×/20× 才适合全天候 Agent。
+- **Google AI Pro（Gemini Advanced + Gemini Code Assist，约 20 美元/月）**：
+  Gemini Apps 侧大致 300（Thinking）+100（Pro）条 prompt/天；Code Assist 侧 1M token 上下文 + 1500 请求/天，但一次 Agent 任务会拆成多次请求，重度 Agent 的体感“扣得很快”，所以你会觉得用量明显不够用。
+- **AWS Kiro Pro（约 20 美元/月）**：
+  新版定价只有 225 vibe + 125 spec 请求/月，且额外 spec 要 0.20 美元/次；对个人重度编码者来说远远不够，整体成本会飙到远高于 20 美元档，基本不适合作为主力工具。
+
+***
+
+## 重点一：Codex（基于 ChatGPT Plus）的用量水平
+
+**计费模型**：
+Codex 现在是 ChatGPT 付费计划里的一个“软件工程 Agent 套件”，不需要单独买 Codex 订阅：Plus/Pro/Business/Enterprise 都内含 Codex Web、CLI 和 IDE 扩展。
+
+**限制大致有三层**：
+
+1. **5 小时滚动窗口**
+    - 官方 Codex FAQ 给的区间：Plus 用户在 5 小时时段内，大概可以发 **33–168 条 Codex 本地消息**，具体取决于模型、速度和任务复杂度。
+    - 另一篇定价解析给出的量级类似：**30–150 条本地消息或 5–40 个云端 Codex 任务/5 小时**（云任务就是你在 Web 上丢给 Codex 跑 1–30 分钟的一整段 Agent 工作）。
+2. **周配额**
+    - OpenAI 没公开精确数字，但实践中不少人冲刺几天后会出现“多天冷却期”提示，需要等周配额刷新或额外买 Credits。
+3. **模型/速度权重**
+    - 用越贵的模型（例如更高版本 GPT‑5 Codex）或开更高速度，单消息消耗的 Credit 越大，同样 5 小时窗口可用的“条数”就越少。
+
+**体感可以坚持多久？**
+
+根据 CLI 订阅解析和用户反馈：
+
+- 如果你持续、高频地让 Codex 重构、跑测试、多文件修改，**一个 5 小时窗口里大概能有 1.5–2 小时的“全程高强度 Codex 时间”**，之后就会被限流到下个时间窗。
+- 合理拆分成上午/下午/晚上几个高强度时段，一天里 Codex 能“认真帮你干活”的时间大致 3–5 小时；如果天天这么干，周配额有机会被打满。
+- 对“中度使用”（大量补全 + 少量重型 Agent），Plus 的 Codex 容量通常够用，同时还能拿 ChatGPT 做文档、解释、调试分析等通用任务，这一块性价比相对 Claude Pro 略占优。
+
+***
+
+## 重点二：Claude Code（基于 Claude Pro）的用量水平
+
+**统一用量桶**：
+Claude Pro 20 美元/月，年付折算约 17 美元；Claude Web 与 Claude Code 共用同一个 Pro 用量桶（5 小时滚动窗口 + 周配额）。
+
+**总体消息容量**：
+
+- 官方 usage 文章：若对话不太长、文件也不是特别大，**Pro 用户 5 小时里大概能发 45 条 Sonnet 消息**，比免费版大约多 5 倍。
+- 按照 5 小时滚动窗口换算，一天分散使用可以达到 **200–216 条短消息**，前提是你不是一直扔巨型 PDF 和长对话。
+- Pro 的总量大约是 Free 的 5 倍；再往上是 Max 5×（100 美元）和 Max 20×（200 美元），分别在容量上乘 5 和乘 20，用于重度工程/Agent 场景。
+
+**Claude Code 专用的经验配额**：
+
+- Anthropic 的说明和 issues 里都强调，**Claude Code 的提示数量比纯聊天少得多**：Pro 级别在 5 小时里大致 **10–40 次 Claude Code 提示**，仓库越大、终端和自动接受用得越多，能用的提示越少。
+- 社区制作的 usage 计数器和经验贴普遍说法是：**中大型项目里连续“认真干活”1.5–2 小时，就会摸到 5 小时上限**，尤其你让 Claude Code 不断自动应用补丁、多次遍历仓库时。
+
+**短促促销不改变长期结构**：
+2026 年 3 月确实有一个“非高峰时段翻倍用量”的促销活动（Free/Pro/Max 都翻倍），但只持续到 3 月下旬，对“长期 20 美元性价比”不能当作常态指标。
+
+***
+
+## Codex vs Claude Code：谁更值 20 美元？
+
+站在你这种“Agent 编程 + 整仓重构”的开发者视角，可以用三个维度看：**纯容量、体验质量、扩容路径。**
+
+### 1. 纯容量与可持续时长
+
+并列比较（都是 20 美元级）：
+
+- **Codex / ChatGPT Plus**
+    - 5 小时里约 30–150 条 Codex 本地消息（具体看复杂度）。
+    - 高强度 Agent 使用约 1.5–2 小时就会触顶一个窗口，但一天拆成几段可以拿到 3–5 小时高强度协作时间。
+- **Claude Code / Claude Pro**
+    - 5 小时里约 10–40 次 Claude Code 提示，外加大约 45 条普通 Sonnet 消息。
+    - 中重度 Agent 使用下，同样 1.5–2 小时左右就会被卡住，但因为 Code 提示本身更“贵”，你会更快体感到紧张。
+
+换算下来：
+**在相同 20 美元价位上，Codex 整体可用的“提示数”和高强度可持续时长，略优于 Claude Code**——尤其当你并不是把全部额度都拿来跑重型 Agent，而是混合 Chat、解释、文档生成时，这个差距会更明显。
+
+### 2. 交互/推理体验质量
+
+- **Claude Code** 在理解长代码、给重构建议、自然语言解释设计决策等方面口碑非常好，很多人拿它做“虚拟架构师”。
+- **Codex** 依托 GPT‑5.x/4.x，在实现能力和联想能力上也不弱，但整体偏“执行很猛”，尤其适合具体实现和迭代，而不是系统性长文档讨论（当然它也能做，只是风格不同）。
+
+如果你经常让模型帮你“想设计 + 给路线 + 再自己实现”，Claude Code 会让你感觉“单次价值高”；
+如果你更希望模型**多跑几次、不断试错/迭代**，Codex 的容量会显得更友好。
+
+### 3. 扩容路径与成本
+
+- **Codex**：可以在 Plus 基础上单独购买额外 ChatGPT/Codex Credits，或者升级到 Pro 200 美元/月；也可以在 IDE 里切到 API Key，直接按 token 计费，这样不吃 Plus 配额。
+- **Claude Code**：当前主要是升级到 Max 5×/20× 或转到 Claude API；等级跃迁是 20→100→200 美元，缺少中间小步扩容，对个人开发者会比较痛。
+
+**结论**：
+
+- 如果你核心诉求是“**尽可能多地跑 Agent/多迭代几轮**”，在 20 美元档里，**Codex（ChatGPT Plus）比 Claude Code 更抗造一点**。
+- 如果你更在意“**每次对话质量、解释深度、架构建议质量**”，可以接受每天只用 Claude Code 解决 1–2 个关键问题，那么 Claude Pro 仍然非常有价值。
+
+***
+
+## Google：为什么你体感“已经没法 Agent 编程”
+
+Google 这边要分两套看：**Gemini Apps（网页/移动）** 与 **Gemini Code Assist（IDE/CLI）**。
+
+### Gemini Apps / AI Pro
+
+- 早期官方写法：AI Pro 订阅每天约 **100 条 Pro 模型 prompts**，免费用户每天只有 5 条 Pro prompt，Context 32K vs 1M。
+- 2026 年 1 月起，Google 调整 Gemini 3 的限额为**分模型计数**：
+    - AI Pro：**300 条 Thinking prompts/天 + 100 条 Pro prompts/天**。
+    - Ultra：1500 + 500 条/天。
+
+对**普通聊天/问答**来说，这个量已经不算少；
+但对**Agent 编程**来说，一次复杂任务常常要十几二十轮交互，而且你还会顺手拿它查文档、改提示、生成说明书……于是**很容易在一天中段就冲到 300+100 的上限**，体感自然是“完全不够用”。
+
+### Gemini Code Assist / Code Agent
+
+Code Assist 官方配额：
+
+- **上下文窗口**：本地代码感知最长可达 **1,000,000 token**，这一点确实在“整仓理解”上很强。
+- **日请求数**：
+    - 通过 Google AI Pro 使用 Code Assist：**1500 次请求/用户/天**。
+    - 免费个人版：1000 次/天；Enterprise：2000 次/天。
+
+问题在于：
+官方文档明确说，**Agent 模式 或 Gemini CLI 下，一个高级任务会被拆成多次底层请求**——比如你只点了一次“修这个包”，后台可能发出几十到上百次接口调用；**所以 1500 次请求对重度 Agent 来说，远没有纸面上看起来那么宽裕。**
+
+结合你的感受，可以合理推断：
+
+- 你如果主要用 **Apps（网页端）+ Pro 模型** 跑 Agent，日常经常撞 100 或 300+100 上限，自然觉得“不能用来做严肃代码”。
+- 即便切到 Code Assist，**1500 请求/天** 在复杂 Agent 链路下也会被快速吃光，尤其你连续多天冲刺时，所以整体体验明显不如当初刚出 Gemini 2.x 时宽松。
+
+***
+
+## Cursor 与 Kiro：两端极端的例子
+
+### Cursor Pro：20 美元档相对最划算的“写码主场”
+
+- 无限补全 + 无限 Auto 模式，不吃 Credit，是 Cursor 性价比的核心。
+- 每月 20 美元的高级模型 Credit，哪怕被几次大型 Agent 用完，你的**基础补全和轻量 Chat 仍然是无限可用**，不会像 Claude/Google 一样整套功能被硬性卡住。
+- 只要你把真正极重的任务分摊到 Codex/Claude/Gemini，而让 Cursor 主打补全 + 中小型重构，它在 20 美元档的“日常可用时间”几乎是最好的。
+
+
+### AWS Kiro Pro：价格结构基本劝退个人
+
+- 新版定价：Pro 20 美元/月只给 **225 vibe + 125 spec 请求**，多一条 spec 要 0.20 美元；对照一些开发者的测算，哪怕只是“轻度编码”，每月也要 3000 spec 左右，成本一下子涨到 500 多美元/月，全职编码甚至预估近 2000 美元/月。
+- 和 Cursor / ChatGPT Plus / Claude Pro / Google AI Pro 的“约 20 美元 = 至少每天几小时可用”逻辑完全不同；对个人来说几乎没法当主力，只适合 AWS 赞助/公司买单的小众用途。
+
+***
+
+## 实际订阅组合建议（针对你这种重度 Agent 用户）
+
+结合上面这些定量和定性信息，你可以考虑把 20 美元档的预算这样分配和使用：
+
+1. **把 Cursor Pro 当主力 IDE**
+    - 日常所有“写实现、补全、局部重构”都尽量走 Cursor 的无限补全 + Auto 模式，保证每天核心工作不被配额卡死。
+    - 只在需要“全仓分析/大迁移/特别难的 Bug”时，才切成手工选用最强模型，让月度 20 美元 Credit 用在刀刃上。
+2. **ChatGPT Plus（Codex）当“高强度 Agent + 通用大脑”**
+    - 把真正需要多轮 Agent 推进的重型场景（复杂 refactor、设计对比、多语言混合项目）交给 Codex 做主攻，利用它在 5 小时窗口里相对更宽松的提示数。
+    - 特别是需要“写文档 + 写脚本 + 写代码”一体化的任务时，让 Codex 完整链路负责，Cursor 用来做本地执行和微调。
+3. **Claude Pro 作为“高价值、低频”专家**
+    - 把 Claude Code 用在关键节点：看架构、审 PR、给重构路线、帮你读晦涩业务逻辑；用 10–40 次 Code 提示/5 小时换来几次 **极高质量的建议**，而不是当流水线码农用。
+4. **Google AI Pro / Gemini Code Assist 只在你必须深度用 Google 生态时保留**
+    - 如果你的仓库在 GCP / Cloud Source / BigQuery 等环境里，1M 上下文 + 1500 请求/天还是有价值的，只是要心理预期：它不是无限 Agent 工厂，而是“大仓库理解 + 关键改动”的专用工具。
+    - 如果只是偶尔用 Gemini 查资料或写点文案，性价比明显不如把这 20 美元挪去加强 Codex / Claude / Cursor。
+5. **明确把 Kiro 排除在“个人主力工具”之外**
+    - 在当前定价下，你几乎不可能以 20 美元的成本获得足够多的 Kiro 任务配额，让它作为日常 Agent 工作台；可以当 AWS 生态里的 demo 工具，别指望它扛起整月工作量。
+
+***