mac-use
在原生 Mac 上使用 LLM 和 MCP 服务器。
hanzoai
README
mac-use
本项目允许您原生控制 macOS,通过原生 macOS 命令和实用程序提供直接的系统控制。
[!CAUTION] 这存在明显的风险。Anthropic 代理可以控制您 Mac 上的所有内容。请务必小心。
功能
- 原生 macOS GUI 交互(无需 Docker)
- 使用原生 macOS 命令进行屏幕截图
- 通过 cliclick 控制键盘和鼠标
- 支持多种 LLM 提供商(Anthropic、Bedrock、Vertex)
- 基于 Streamlit 的界面
- 自动屏幕分辨率缩放
- 文件系统交互和编辑功能
前提条件
- macOS Sonoma 15.7 或更高版本
- Python 3.12+
- Homebrew(用于安装其他依赖项)
- cliclick (
brew install cliclick
) - 控制鼠标和键盘的必需项
安装说明
- 克隆存储库并导航到它:
git clone https://github.com/hanzoai/mac-use.git
cd mac-use
- 创建并激活虚拟环境:
python3.12 -m venv venv
source venv/bin/activate
- 运行安装脚本:
chmod +x setup.sh
./setup.sh
- 安装 Python 依赖项:
pip install -r requirements.txt
运行演示
设置您的环境和 Anthropic API 密钥
- 在
.env
文件中添加:
API_PROVIDER=anthropic
ANTHROPIC_API_KEY=<key>
WIDTH=800
HEIGHT=600
DISPLAY_NUM=1
设置屏幕尺寸(建议:保持在 XGA/WXGA 分辨率范围内),并从 Anthropic Console 中输入您的密钥。
- 启动 Streamlit 应用程序:
streamlit run streamlit.py
该界面将在 http://localhost:8501 上可用
屏幕尺寸注意事项
我们建议使用以下分辨率之一以获得最佳性能:
- XGA:1024x768 (4:3)
- WXGA:1280x800 (16:10)
- FWXGA:1366x768 (~16:9)
更高的分辨率将自动缩小到这些目标,以优化模型性能。您可以使用环境变量设置分辨率:
export WIDTH=1024
export HEIGHT=768
streamlit run streamlit.py
[!IMPORTANT] 此参考实现中使用的 Beta API 可能会发生更改。有关最新信息,请参阅 API 发行说明。
推荐服务器
Playwright MCP Server
一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。
Magic Component Platform (MCP)
一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。
MCP Package Docs Server
促进大型语言模型高效访问和获取 Go、Python 和 NPM 包的结构化文档,通过多语言支持和性能优化来增强软件开发。
Claude Code MCP
一个实现了 Claude Code 作为模型上下文协议(Model Context Protocol, MCP)服务器的方案,它可以通过标准化的 MCP 接口来使用 Claude 的软件工程能力(代码生成、编辑、审查和文件操作)。
@kazuph/mcp-taskmanager
用于任务管理的模型上下文协议服务器。它允许 Claude Desktop(或任何 MCP 客户端)在基于队列的系统中管理和执行任务。
mermaid-mcp-server
一个模型上下文协议 (MCP) 服务器,用于将 Mermaid 图表转换为 PNG 图像。
Jira-Context-MCP
MCP 服务器向 AI 编码助手(如 Cursor)提供 Jira 工单信息。

Linear MCP Server
一个模型上下文协议(Model Context Protocol)服务器,它与 Linear 的问题跟踪系统集成,允许大型语言模型(LLM)通过自然语言交互来创建、更新、搜索和评论 Linear 问题。

Sequential Thinking MCP Server
这个服务器通过将复杂问题分解为顺序步骤来促进结构化的问题解决,支持修订,并通过完整的 MCP 集成来实现多条解决方案路径。
Curri MCP Server
通过管理文本笔记、提供笔记创建工具以及使用结构化提示生成摘要,从而实现与 Curri API 的交互。