macOS Screen View & Control MCP Server

macOS Screen View & Control MCP Server

MCP 服务器,用于截图和控制 macOS 窗口 (专为 Cursor 设计)

jhead

开发者工具
访问服务器

README

macOS 屏幕视图 & 控制 MCP 服务器

一个提供窗口截图功能的模型上下文协议服务器。此服务器使 LLM 能够通过窗口标题或窗口 ID 捕获 macOS 上特定窗口的屏幕截图。

可用工具

  • capture_window_screenshot - 捕获特定窗口的屏幕截图,通过其标题或 ID

    • window_identifier (字符串, 必需): 要搜索的窗口标题或窗口 ID
    • search_in_owner (布尔值, 可选): 是否在窗口所有者名称中搜索 (默认: true)
    • format (字符串, 可选): 输出格式 (binary 或 base64) (默认: "binary")
  • list_windows - 列出所有可见窗口

    • 无需参数
  • find_window - 通过标题或所有者名称查找窗口

    • title (字符串, 必需): 要搜索的窗口标题或所有者名称
    • search_in_owner (布尔值, 可选): 是否在窗口所有者名称中搜索 (默认: true)
  • send_key - 向活动窗口发送键盘按键事件

    • key (字符串, 必需): 要按下的键 (例如, 'a', 'return', 'space')
    • modifiers (字符串列表, 可选): 要按住的修饰键列表 (例如, ['command', 'shift'])
  • type_text - 输入一段文本字符

    • text (字符串, 必需): 要输入的文本
    • delay (浮点数, 可选): 每次按键之间的延迟,以秒为单位 (默认: 0.1)

支持的键

支持以下键:

  • 字母:a-z(不区分大小写)
  • 数字:0-9
  • 特殊键:return, tab, space, delete, escape
  • 箭头键:up_arrow, down_arrow, left_arrow, right_arrow
  • 修饰键:command, shift, control, option (以及 right_shift, right_option, right_control)

示例

发送单个按键:

await send_key("return")

发送带有修饰键的键:

await send_key("c", ["command"])  # Command+C (复制)

输入文本:

await type_text("Hello, World!")

安装

使用 pip

通过 pip 安装 macos_screen_mcp

pip install git+ssh://git@github.com/jhead/macos-screen-mcp.git

安装后,您可以将其作为脚本运行:

python -m macos_screen_mcp

配置

配置

添加到您的 Claude 或 Cursor 设置:

"mcpServers": {
 "macos-screen": {
    "name": "macos-screen",
    "url": "http://localhost:8000/sse",
    "description": "MCP server for capturing window screenshots",
    "version": "1.0.0"
  }
}

调试

您可以使用 MCP 检查器来调试服务器:

npx @modelcontextprotocol/inspector python -m macos_screen_mcp

贡献

我们鼓励您贡献力量,以帮助扩展和改进 macos-screen-mcp。 无论您是想添加新工具、增强现有功能还是改进文档,您的投入都很有价值。

欢迎提交 Pull Request! 随时贡献新的想法、错误修复或增强功能,以使 macos-screen-mcp 更加强大和有用。

许可证

macos-screen-mcp 在 MIT 许可证下获得许可。 这意味着您可以自由使用、修改和分发该软件,但须遵守 MIT 许可证的条款和条件。 有关更多详细信息,请参阅项目存储库中的 LICENSE 文件。

推荐服务器

Playwright MCP Server

Playwright MCP Server

一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。

官方
精选
TypeScript
Magic Component Platform (MCP)

Magic Component Platform (MCP)

一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。

官方
精选
本地
TypeScript
MCP Package Docs Server

MCP Package Docs Server

促进大型语言模型高效访问和获取 Go、Python 和 NPM 包的结构化文档,通过多语言支持和性能优化来增强软件开发。

精选
本地
TypeScript
Claude Code MCP

Claude Code MCP

一个实现了 Claude Code 作为模型上下文协议(Model Context Protocol, MCP)服务器的方案,它可以通过标准化的 MCP 接口来使用 Claude 的软件工程能力(代码生成、编辑、审查和文件操作)。

精选
本地
JavaScript
@kazuph/mcp-taskmanager

@kazuph/mcp-taskmanager

用于任务管理的模型上下文协议服务器。它允许 Claude Desktop(或任何 MCP 客户端)在基于队列的系统中管理和执行任务。

精选
本地
JavaScript
mermaid-mcp-server

mermaid-mcp-server

一个模型上下文协议 (MCP) 服务器,用于将 Mermaid 图表转换为 PNG 图像。

精选
JavaScript
Jira-Context-MCP

Jira-Context-MCP

MCP 服务器向 AI 编码助手(如 Cursor)提供 Jira 工单信息。

精选
TypeScript
Linear MCP Server

Linear MCP Server

一个模型上下文协议(Model Context Protocol)服务器,它与 Linear 的问题跟踪系统集成,允许大型语言模型(LLM)通过自然语言交互来创建、更新、搜索和评论 Linear 问题。

精选
JavaScript
Sequential Thinking MCP Server

Sequential Thinking MCP Server

这个服务器通过将复杂问题分解为顺序步骤来促进结构化的问题解决,支持修订,并通过完整的 MCP 集成来实现多条解决方案路径。

精选
Python
Curri MCP Server

Curri MCP Server

通过管理文本笔记、提供笔记创建工具以及使用结构化提示生成摘要,从而实现与 Curri API 的交互。

官方
本地
JavaScript