
Safari Screenshot MCP Server
通过 Node.js 服务器,可以使用 Safari 浏览器捕获高质量的 macOS 原生屏幕截图,并支持各种尺寸、缩放级别和加载等待时间。
Tools
take_screenshot
Take a screenshot of a webpage using Safari on macOS
README
Safari 截图
一个 Node.js MCP 服务器,用于使用 macOS 上的 Safari 浏览器捕获屏幕截图。
功能
- 以特定尺寸捕获窗口截图
- 支持不同的缩放级别
- 可配置的页面加载等待时间
- 捕获后清理
- 原生 macOS 截图质量
用法
import { takeScreenshot } from './screenshot.js';
// 基本窗口截图
await takeScreenshot({
url: 'https://www.apple.com',
outputPath: './screenshot.png',
width: 1024, // 可选:窗口宽度(默认:1024)
height: 768, // 可选:窗口高度(默认:768)
waitTime: 3, // 可选:页面加载等待秒数(默认:3)
zoomLevel: 1, // 可选:页面缩放级别(默认:1)
});
// 响应式设计测试
await takeScreenshot({
url: 'https://www.apple.com',
outputPath: './mobile.png',
width: 375, // iPhone SE 宽度
height: 667, // iPhone SE 高度
zoomLevel: 1,
});
// 高分辨率捕获
await takeScreenshot({
url: 'https://www.apple.com',
outputPath: './desktop-hd.png',
width: 1920, // Full HD 宽度
height: 1080, // Full HD 高度
waitTime: 5, // 等待更长时间加载 HD 内容
zoomLevel: 0.8, // 稍微缩小
});
要求
- macOS
- Safari
- Node.js >= 14.0.0
- 终端需要辅助功能权限(系统偏好设置 → 安全性与隐私 → 隐私 → 辅助功能)
安装
npm install safari-screenshot
选项
选项 | 类型 | 默认值 | 描述 |
---|---|---|---|
url | string | 必需 | 要捕获的 URL |
outputPath | string | 自动 | 保存屏幕截图的位置(默认:./screenshots/[hostname]-[timestamp].png) |
width | number | 1024 | 窗口宽度,以像素为单位 |
height | number | 768 | 窗口高度,以像素为单位 |
waitTime | number | 3 | 页面加载等待秒数 |
zoomLevel | number | 1 | 页面缩放级别(1 = 100%) |
常用视口尺寸
该模块已使用以下常用视口尺寸进行测试:
- 桌面:1920×1080 (Full HD)
- 笔记本电脑:1366×768
- 平板电脑横向:1024×768
- 平板电脑纵向:768×1024
- 移动设备大:428×926 (iPhone 12 Pro Max)
- 移动设备中:390×844 (iPhone 12 Pro)
- 移动设备小:375×667 (iPhone SE)
工作原理
- 使用指定的窗口大小打开 Safari 浏览器
- 加载 URL 并等待页面加载
- 如果指定,则应用缩放级别
- 使用原生 macOS 屏幕截图功能,实现像素级完美效果
- 验证屏幕截图是否成功捕获
- 清理 Safari 浏览器窗口
权限
此软件包需要系统事件权限才能工作:
- 打开系统偏好设置 > 安全性与隐私 > 隐私 > 辅助功能
- 将终端(或您的 IDE)添加到允许的应用程序列表中
与 Cursor 一起使用
在 Cursor 中设置
-
打开 Cursor
-
转到设置,"添加 MCP 服务器"
-
在配置对话框中:
- 名称:
safari-screenshot
- 类型:
command
- 命令:
npx -y @rogerheykoop/mcp-safari-screenshot
或者对于本地开发:
- 命令:
npx -y /path/to/mcp-safari-screenshot/server.js
- 名称:
示例命令
在 Cursor 中连接到服务器后,您可以使用以下命令:
Take a screenshot of https://apple.com at desktop size
响应:将以 1920×1080 捕获
Capture https://apple.com on iPhone 12 Pro
响应:将以 390×844 捕获
Screenshot github.com at 50% zoom
响应:将以 zoomLevel: 0.5 捕获
支持的参数
MCP 服务器理解以下概念:
- 设备名称(例如,“iPhone”、“iPad”、“desktop”)
- 尺寸(例如,“1024x768”)
- 缩放级别(例如,“50% zoom”、“2x zoom”)
- 等待时间(例如,“wait 5 seconds”)
示例工作流程
-
响应式测试
Take screenshots of apple.com on iPhone, iPad, and desktop
-
缩放测试
Capture github.com at 75% zoom and 125% zoom
-
自定义尺寸
Screenshot example.com at 1440x900
提示
- 屏幕截图默认保存到
screenshots
目录 - 设备名称自动设置适当的尺寸
- 服务器处理 Safari 浏览器窗口的清理
- 对于加载缓慢的页面,请使用“wait X seconds”
故障排除
如果遇到问题:
- 检查终端是否具有辅助功能权限
- 验证 Safari 浏览器是否未处于无痕浏览模式
- 确保工作目录可写
- 检查 Cursor 的控制台是否有错误消息
许可证
MIT
本地测试
您可以直接测试 MCP 实现:
# 测试发现
echo '{"type":"discover"}' | npx -y ./server.js
# 测试截图
echo '{"type":"execute","tool":"take_screenshot","input":"Take a screenshot of https://apple.com","requestId":"123"}' | npx -y ./server.js
预期响应:
- Discover 将返回功能
- Execute 将:
- 将进度记录到 stderr
- 将结果 JSON 返回到 stdout
- 将屏幕截图保存到 ./screenshots/
推荐服务器
Playwright MCP Server
一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。
Magic Component Platform (MCP)
一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。
Audiense Insights MCP Server
通过模型上下文协议启用与 Audiense Insights 账户的交互,从而促进营销洞察和受众数据的提取和分析,包括人口统计信息、行为和影响者互动。
graphlit-mcp-server
模型上下文协议 (MCP) 服务器实现了 MCP 客户端与 Graphlit 服务之间的集成。 除了网络爬取之外,还可以将任何内容(从 Slack 到 Gmail 再到播客订阅源)导入到 Graphlit 项目中,然后从 MCP 客户端检索相关内容。
Excel MCP Server
一个模型上下文协议服务器,使 AI 助手能够读取和写入 Microsoft Excel 文件,支持诸如 xlsx、xlsm、xltx 和 xltm 等格式。
Playwright MCP Server
提供一个利用模型上下文协议的服务器,以实现类人浏览器的自动化,该服务器使用 Playwright,允许控制浏览器行为,例如导航、元素交互和滚动。
MCP Package Docs Server
促进大型语言模型高效访问和获取 Go、Python 和 NPM 包的结构化文档,通过多语言支持和性能优化来增强软件开发。
@kazuph/mcp-fetch
用于获取网页内容和处理图像的模型上下文协议服务器。这使得 Claude Desktop(或任何 MCP 客户端)能够适当地获取网页内容和处理图像。
Claude Code MCP
一个实现了 Claude Code 作为模型上下文协议(Model Context Protocol, MCP)服务器的方案,它可以通过标准化的 MCP 接口来使用 Claude 的软件工程能力(代码生成、编辑、审查和文件操作)。
@kazuph/mcp-taskmanager
用于任务管理的模型上下文协议服务器。它允许 Claude Desktop(或任何 MCP 客户端)在基于队列的系统中管理和执行任务。