[tools] | 2026-06-11 | 7 min

# 浏览器自动化 + MCP：Agent 如何"看见"前端

Playwright + MCP Server 让 Coding Agent 能够真正"看到"和"操作"浏览器——这是 AI4SE 工具链中最被低估的能力。

[mcp-protocol][tools]

为什么 Agent 需要浏览器

视觉验证：Agent 生成 UI 后自己”看到”效果
E2E 测试：Agent 像用户一样操作自己的产出
调试：Agent 在浏览器中复现和修复 bug

技术栈

Coding Agent → MCP Client → Playwright MCP Server → Chromium

实践

npx @anthropic-ai/mcp-server-puppeteer — 最简单的起步
给 Agent 权限：允许截图、点击、填表
让 Agent 先跑测试再提交

注意

浏览器自动化容易被滥用——限制在测试环境
Agent 的浏览器操作应该像用户，而非爬虫
结合 Review Pipeline：Agent 跑测试截图，人看截图做最终判断