# 浏览器自动化 + MCP:Agent 如何"看见"前端
Playwright + MCP Server 让 Coding Agent 能够真正"看到"和"操作"浏览器——这是 AI4SE 工具链中最被低估的能力。
为什么 Agent 需要浏览器
- 视觉验证:Agent 生成 UI 后自己”看到”效果
- E2E 测试:Agent 像用户一样操作自己的产出
- 调试:Agent 在浏览器中复现和修复 bug
技术栈
Coding Agent → MCP Client → Playwright MCP Server → Chromium
实践
npx @anthropic-ai/mcp-server-puppeteer— 最简单的起步- 给 Agent 权限:允许截图、点击、填表
- 让 Agent 先跑测试再提交
注意
- 浏览器自动化容易被滥用——限制在测试环境
- Agent 的浏览器操作应该像用户,而非爬虫
- 结合 Review Pipeline:Agent 跑测试截图,人看截图做最终判断