Computer Use AI SDK
m13v
README
计算机使用 AI SDK
-
我们构建了一个控制计算机的 MCP 服务器
-
你听说过 OpenAI 的 operator,也听说过 Claude 的 computer use。现在有了开源替代方案:来自 screenpipe 的计算机使用 SDK。
-
它是 macOS 原生的——没有虚拟机的麻烦,没有护栏限制。你可以随心所欲地将其与任何应用程序或网站一起使用。
-
没有基于像素的麻烦——它依赖于底层桌面渲染元素,使其比基于像素的视觉模型更快、更可靠。
-
现在,你可以使用我们的 MCP 服务器和客户端,通过我们简单的 Hello World 模板开始构建你自己的代理。
-
我们的 MCP 服务器开箱即用提供以下工具:
- 启动应用程序
- 读取内容
- 点击
- 输入文本
- 按键
-
这些将是计算原语,允许 AI 控制你的计算机并为你完成任务。你会构建什么?快来 https://screenpi.pe 看看我们吧
演示
代理发送消息
https://github.com/user-attachments/assets/f8687500-9a8c-4a96-81b6-77562feff093
获取最新的 WhatsApp 消息
打开 Arc 浏览器
开始使用
git clone https://github.com/m13v/computer-use-ai-sdk.git
cd MCP-server-client-computer-use-ai-sdk
# 安装 Rust (如果尚未安装)
curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh
# 安装 Node.js 和 npm (如果尚未安装)
# 访问 https://nodejs.org/ 或使用 nvm
# 运行后端服务器
cd mcp-server-os-level
cargo run --bin server
# 保持运行
选项 1:CLI 界面
# 在新终端中运行 CLI 界面客户端(适合调试)
cd mcp-client-cli-interface
npm install # 首先安装依赖项
# 将你的 Anthropic API 密钥设置为环境变量
export ANTHROPIC_API_KEY=sk-ant-xxxx # 替换为你的实际 Anthropic API 密钥
# 对于 Windows,使用:set ANTHROPIC_API_KEY=sk-ant-xxxx
# 对于永久设置,添加到你的 shell 配置文件 (.bashrc, .zshrc 等)
npx tsx main.ts
选项 2:Web 应用界面
# 在新终端中运行 CLI 界面客户端(适合调试)
cd mcp-client-nextjs
npm install # 首先安装依赖项
# 通过命令行设置 API 密钥
echo "ANTHROPIC_API_KEY=sk-ant-XXXXXXXX" > .env # 将 XXXXXXXX 替换为你的实际密钥
# 或者追加,如果你想保留其他 env 变量
# echo "ANTHROPIC_API_KEY=sk-ant-XXXXXXXX" >> .env
npm run dev
# 前往提供的 localhost 网页
我可以用它做什么?
- 构建自定义的代理工作流程来执行各种操作
- 构建自定义 UI,方便用户自动化他们的计算机工作
- 保存工作流程并在 cron 中运行
- 与其他 MCP 服务器结合使用以完成一些很酷的事情,例如:根据我一天中与人交谈的历史记录填写 Google 表格
在 github issues 中请求功能和端点
https://github.com/m13v/computer-use-ai-sdk/issues/new/choose
推荐服务器
Crypto Price & Market Analysis MCP Server
一个模型上下文协议 (MCP) 服务器,它使用 CoinCap API 提供全面的加密货币分析。该服务器通过一个易于使用的界面提供实时价格数据、市场分析和历史趋势。 (Alternative, slightly more formal and technical translation): 一个模型上下文协议 (MCP) 服务器,利用 CoinCap API 提供全面的加密货币分析服务。该服务器通过用户友好的界面,提供实时价格数据、市场分析以及历史趋势数据。
MCP PubMed Search
用于搜索 PubMed 的服务器(PubMed 是一个免费的在线数据库,用户可以在其中搜索生物医学和生命科学文献)。 我是在 MCP 发布当天创建的,但当时正在度假。 我看到有人在您的数据库中发布了类似的服务器,但还是决定发布我的服务器。
mixpanel
连接到您的 Mixpanel 数据。 从 Mixpanel 分析查询事件、留存和漏斗数据。

Sequential Thinking MCP Server
这个服务器通过将复杂问题分解为顺序步骤来促进结构化的问题解决,支持修订,并通过完整的 MCP 集成来实现多条解决方案路径。

Nefino MCP Server
为大型语言模型提供访问德国可再生能源项目新闻和信息的能力,允许按地点、主题(太阳能、风能、氢能)和日期范围进行筛选。
Vectorize
将 MCP 服务器向量化以实现高级检索、私有深度研究、Anything-to-Markdown 文件提取和文本分块。
Mathematica Documentation MCP server
一个服务器,通过 FastMCP 提供对 Mathematica 文档的访问,使用户能够从 Wolfram Mathematica 检索函数文档和列出软件包符号。
kb-mcp-server
一个 MCP 服务器,旨在实现便携性、本地化、简易性和便利性,以支持对 txtai “all in one” 嵌入数据库进行基于语义/图的检索。任何 tar.gz 格式的 txtai 嵌入数据库都可以被加载。
Research MCP Server
这个服务器用作 MCP 服务器,与 Notion 交互以检索和创建调查数据,并与 Claude Desktop Client 集成以进行和审查调查。

Cryo MCP Server
一个API服务器,实现了模型补全协议(MCP),用于Cryo区块链数据提取,允许用户通过任何兼容MCP的客户端查询以太坊区块链数据。