[research@ai4se] : ~ $
cd ../
[process] | | 14 min

# GStack + GSD + Superpowers:长时程 Agentic 交付栈

GStack 管专家决策,GSD 管 phase 编排与 context 隔离,Superpowers 管 TDD 与验证纪律——受控自治而非无边界 overnight build。

[tool-integration][process]

GStack、GSD、Superpowers 可组合成高自治端到端软件开发工作流——但推荐方式不是三套框架同时「管全流程」,而是 分层职责 + 受控自治(guarded autonomy)

层级主工具核心职责
决策与专家评审层GStack产品/工程/设计/QA/发布专家模式
阶段分解与上下文控制层GSDDiscuss→Plan→Execute→Verify→Ship;fresh-context subagents
工程纪律与验证层SuperpowersTDD、systematic-debugging、verification-before-completion
GStack Spec Council → Superpowers Refinement → GSD Phase Graph
→ Build Loop → Superpowers TDD → GStack QA/Review/Ship → Retro

OpenSpec + Superpowers + gstack 的差异:本栈用 GSD 替代 OpenSpec 承担 phase 编排与 context 控制,更适合长时程、多 phase、需 fresh context 的 feature,而非 brownfield delta spec 管理。

补齐的三个短板

  1. 决策短板 — 通用 agent 混产品/工程/设计/QA;GStack 用显式 gears 拆开
  2. 上下文短板 — 长任务 context rot;GSD 用 phase loop + fresh-context subagents
  3. 验证短板 — AI 自评过度乐观;Superpowers TDD + verification + GStack QA 三重证据

各层定位

GStack — 专家决策与交付闭环

能力命令
产品/战略/office-hours/plan-ceo-review
工程/设计 plan review/plan-eng-review/plan-design-review
浏览器 QA/qa
发布/复盘/ship/retro

GSD — Phase 编排与 Context 工程

Discuss → Plan → Execute → Verify → Ship
  • 每个 execution unit 获得 fresh context
  • Phase 边界限制上下文负载
  • 强制 handoff 文件串联 phase

Superpowers — 工程纪律内核

brainstorming → writing-plans → TDD → systematic-debugging → verification-before-completion → code review

推荐架构

GStack 起草方向 (/office-hours)

Superpowers 澄清 (brainstorming → writing-plans)

GSD 拆 phase (Discuss → Plan)

GStack 审查计划 (/plan-eng-review, /plan-design-review)

Build Loop 遍历 phase(每 phase 内 Superpowers TDD)

GStack /qa + /review

GStack /ship + /retro

目录结构

repo/
├── .gsd/phases/          # phase contracts
├── .gsd/handoffs/        # phase 交接
├── docs/superpowers/     # 实施计划
├── .gstack/qa-reports/   # QA 证据
├── AGENTS.md             # 路由规则
└── src/

AGENTS.md 路由

- GStack owns multi-role decisions, plan/design reviews, browser QA, ship, retro.
- GSD owns phase decomposition, context budget, handoffs, phase verify/ship.
- Superpowers owns TDD, debugging, verification-before-completion, code review.
- Scope/data model/security/pricing changes → stop for human approval.
- Every phase must produce tests, verification evidence, and handoff before next phase.

中途决策策略

问题类型自动处理需人工
文案、布局密度GStack design role
测试命名、低风险实现细节Superpowers plan 约束
范围取舍、商业优先级GStack CEO 建议视风险
数据模型、权限、安全、计费停止
发布/迁移/生产影响停止

决策写入 .gstack/decisions/.gsd/handoffs/

适合 vs 不适合

高适配:

  • 跨多文件/模块的中型 feature
  • UI + API + domain + tests 的 full-stack 变更
  • 可通过测试、浏览器 QA、PR diff 验证的任务
  • 可被 phase 边界约束的长时程工作

不建议完整启用:

  • 30 分钟内小修
  • 需求高度不确定需大量人类探索
  • 高风险改动无 human gate
  • 测试基础薄弱无法提供自动验证信号

风险与控制

风险控制
工具职责重叠AGENTS.md 明确 routing
过夜任务失控phase contract、预算、checkpoint commit
多角色投票幻觉高风险 human gate、决策记录
TDD 流于形式GStack eng review 审查 failure modes
上下文交接缺失强制 handoff 文件
Claude Code 生态依赖核心路由/phase contract 写成工具无关 Markdown

与 GSD 单独使用的对比

维度GSD aloneGStack + GSD + Superpowers
Context 控制
专家审查GStack gears
TDD 纪律配置可选Superpowers 强制
长时程自治phase graph+ Build Loop + 决策 delegation

SDD 选型背景:SDD 工具对比(GSD 位于执行编排端)。

试点度量

  • 需求澄清轮次
  • phase 通过率
  • 测试先行比例
  • 中途问题自动解决率 vs 人工中断次数
  • QA 发现缺陷数、PR critical findings
  • lead time / rework time

参考