# GStack + GSD + Superpowers:长时程 Agentic 交付栈
GStack 管专家决策,GSD 管 phase 编排与 context 隔离,Superpowers 管 TDD 与验证纪律——受控自治而非无边界 overnight build。
GStack、GSD、Superpowers 可组合成高自治端到端软件开发工作流——但推荐方式不是三套框架同时「管全流程」,而是 分层职责 + 受控自治(guarded autonomy):
| 层级 | 主工具 | 核心职责 |
|---|---|---|
| 决策与专家评审层 | GStack | 产品/工程/设计/QA/发布专家模式 |
| 阶段分解与上下文控制层 | GSD | Discuss→Plan→Execute→Verify→Ship;fresh-context subagents |
| 工程纪律与验证层 | Superpowers | TDD、systematic-debugging、verification-before-completion |
GStack Spec Council → Superpowers Refinement → GSD Phase Graph
→ Build Loop → Superpowers TDD → GStack QA/Review/Ship → Retro
与 OpenSpec + Superpowers + gstack 的差异:本栈用 GSD 替代 OpenSpec 承担 phase 编排与 context 控制,更适合长时程、多 phase、需 fresh context 的 feature,而非 brownfield delta spec 管理。
补齐的三个短板
- 决策短板 — 通用 agent 混产品/工程/设计/QA;GStack 用显式 gears 拆开
- 上下文短板 — 长任务 context rot;GSD 用 phase loop + fresh-context subagents
- 验证短板 — AI 自评过度乐观;Superpowers TDD + verification + GStack QA 三重证据
各层定位
GStack — 专家决策与交付闭环
| 能力 | 命令 |
|---|---|
| 产品/战略 | /office-hours、/plan-ceo-review |
| 工程/设计 plan review | /plan-eng-review、/plan-design-review |
| 浏览器 QA | /qa |
| 发布/复盘 | /ship、/retro |
GSD — Phase 编排与 Context 工程
Discuss → Plan → Execute → Verify → Ship
- 每个 execution unit 获得 fresh context
- Phase 边界限制上下文负载
- 强制 handoff 文件串联 phase
Superpowers — 工程纪律内核
brainstorming → writing-plans → TDD → systematic-debugging → verification-before-completion → code review
推荐架构
GStack 起草方向 (/office-hours)
↓
Superpowers 澄清 (brainstorming → writing-plans)
↓
GSD 拆 phase (Discuss → Plan)
↓
GStack 审查计划 (/plan-eng-review, /plan-design-review)
↓
Build Loop 遍历 phase(每 phase 内 Superpowers TDD)
↓
GStack /qa + /review
↓
GStack /ship + /retro
目录结构
repo/
├── .gsd/phases/ # phase contracts
├── .gsd/handoffs/ # phase 交接
├── docs/superpowers/ # 实施计划
├── .gstack/qa-reports/ # QA 证据
├── AGENTS.md # 路由规则
└── src/
AGENTS.md 路由
- GStack owns multi-role decisions, plan/design reviews, browser QA, ship, retro.
- GSD owns phase decomposition, context budget, handoffs, phase verify/ship.
- Superpowers owns TDD, debugging, verification-before-completion, code review.
- Scope/data model/security/pricing changes → stop for human approval.
- Every phase must produce tests, verification evidence, and handoff before next phase.
中途决策策略
| 问题类型 | 自动处理 | 需人工 |
|---|---|---|
| 文案、布局密度 | GStack design role | 否 |
| 测试命名、低风险实现细节 | Superpowers plan 约束 | 否 |
| 范围取舍、商业优先级 | GStack CEO 建议 | 视风险 |
| 数据模型、权限、安全、计费 | 停止 | 是 |
| 发布/迁移/生产影响 | 停止 | 是 |
决策写入 .gstack/decisions/ 与 .gsd/handoffs/。
适合 vs 不适合
高适配:
- 跨多文件/模块的中型 feature
- UI + API + domain + tests 的 full-stack 变更
- 可通过测试、浏览器 QA、PR diff 验证的任务
- 可被 phase 边界约束的长时程工作
不建议完整启用:
- 30 分钟内小修
- 需求高度不确定需大量人类探索
- 高风险改动无 human gate
- 测试基础薄弱无法提供自动验证信号
风险与控制
| 风险 | 控制 |
|---|---|
| 工具职责重叠 | AGENTS.md 明确 routing |
| 过夜任务失控 | phase contract、预算、checkpoint commit |
| 多角色投票幻觉 | 高风险 human gate、决策记录 |
| TDD 流于形式 | GStack eng review 审查 failure modes |
| 上下文交接缺失 | 强制 handoff 文件 |
| Claude Code 生态依赖 | 核心路由/phase contract 写成工具无关 Markdown |
与 GSD 单独使用的对比
| 维度 | GSD alone | GStack + GSD + Superpowers |
|---|---|---|
| Context 控制 | 强 | 强 |
| 专家审查 | 弱 | GStack gears |
| TDD 纪律 | 配置可选 | Superpowers 强制 |
| 长时程自治 | phase graph | + Build Loop + 决策 delegation |
SDD 选型背景:SDD 工具对比(GSD 位于执行编排端)。
试点度量
- 需求澄清轮次
- phase 通过率
- 测试先行比例
- 中途问题自动解决率 vs 人工中断次数
- QA 发现缺陷数、PR critical findings
- lead time / rework time