
MCP Webcam Server
使用户能够将实时摄像头图像发送到 Claude Desktop 或其他 MCP 客户端,从而通过捕获图像、屏幕截图以及提供摄像头视图进行视觉输入,促进互动。
Tools
capture
Gets the latest picture from the webcam. You can use this if the human asks questions about their immediate environment, if you want to see the human or to examine an object they may be referring to or showing you.
screenshot
Gets a screenshot of the current screen or window
README
mcp-webcam
使用你的摄像头向 Claude Desktop (或其他 MCP 客户端) 发送实时图像。
提供 "capture"
和 "screenshot"
工具,允许 Claude 从摄像头获取帧或启动截屏。
还提供了一个 来自摄像头的当前视图
资源。
安装
NPM 包是 @llmindset/mcp-webcam
。
为你的平台安装最新版本的 NodeJS,然后将以下内容添加到你的 claude_desktop_config.json
文件的 mcpServers
部分:
"webcam": {
"command": "npx",
"args": [
"-y",
"@llmindset/mcp-webcam"
]
}
只要你使用的是 Claude Desktop 0.78 或更高版本,这将在 Windows 和 MacOS 上都能工作。
接受一个参数来设置嵌入式 Express 服务器的端口。
默认端口是 3333
(以避免与 Inspector 一起使用时发生冲突)。
用法
启动 Claude Desktop,并连接到 http://localhost:3333
。 然后你可以要求 Claude 获取我摄像头中的最新图片
,或者 Claude,看看我拿着什么
,或者 我穿什么颜色的上衣?
。 你可以“冻结”当前图像,然后将其返回给 Claude,而不是实时捕获。
你可以请求截屏 - 导航到浏览器,以便在请求进入时可以引导捕获区域。 屏幕截图会自动调整大小,以便 Claude 可以管理(如果你有 4K 屏幕,这将非常有用)。 该按钮用于测试你的平台特定的屏幕截图 UX - 除了让你为 Claude 发起的请求做好准备之外,它什么也不做。 注意:这在 Safari 上不起作用,因为它需要人工启动。
MCP 采样
按下“我拿着什么?”按钮,向客户端发送一个采样请求,其中包含图像和问题 用户拿着什么?
。
[!TIP] Claude Desktop 目前不支持采样。 如果你想要一个可以处理多模态采样请求的客户端,请尝试 https://github.com/evalstate/fast-agent/
其他说明
就这些了。
构建此 MCP 服务器是为了演示在 MCP 服务器上公开用户界面,并将实时资源返回给 Claude Desktop。
如果你想构建一个本地的、交互式的 MCP 服务器,这个项目可能会很有用。
感谢 https://github.com/tadasant 在测试和设置方面的帮助。
请阅读 https://llmindset.co.uk/posts/2025/01/resouce-handling-mcp 上的文章,了解有关在 LLM / MCP 聊天应用程序中处理文件和资源的更多详细信息,以及你为什么要这样做。
第三方 MCP 服务
<a href="https://glama.ai/mcp/servers/plbefh6h9w"><img width="380" height="200" src="https://glama.ai/mcp/servers/plbefh6h9w/badge" alt="Webcam Server MCP server" /></a>
推荐服务器
Magic Component Platform (MCP)
一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。
@kazuph/mcp-fetch
用于获取网页内容和处理图像的模型上下文协议服务器。这使得 Claude Desktop(或任何 MCP 客户端)能够适当地获取网页内容和处理图像。
mermaid-mcp-server
一个模型上下文协议 (MCP) 服务器,用于将 Mermaid 图表转换为 PNG 图像。
mcp-pinterest
用于图像搜索和信息检索的 Pinterest 模型上下文协议 (MCP) 服务器
DeepSRT MCP Server
一个 MCP 服务器,通过与 DeepSRT 的 API 集成,使用户能够以多种语言和格式生成 YouTube 视频的摘要。
ScreenshotOne MCP Server
一个官方的 MCP 服务器实现,它允许 AI 助手通过 ScreenshotOne API 捕获网站截图,从而在对话期间提供来自网页的视觉上下文。
Glif
通过 MCP 运行托管在 Glif.app 上的 AI 工作流程,包括基于 ComfyUI 的图像生成器、表情包生成器、自拍、链式 LLM 调用等等。
WebPerfect MCP Server
一个智能的MCP服务器,具有全自动化的批处理流水线,可用于生成适用于网络的图像。功能包括降噪、自动色阶/曲线、JPEG伪影去除、4K调整大小、智能锐化(带阴影/高光增强)以及高级WebP转换。
Stealth Browser MCP Server
使用 Playwright 提供隐身浏览器功能,采用反检测技术,使 MCP 客户端能够浏览网站并截取屏幕截图,同时规避常见的机器人检测系统。

Video Editor MCP Server
使用自然语言命令进行视频编辑,由 FFmpeg 提供支持,支持剪辑、合并、格式转换等操作,并具有实时进度跟踪和错误处理功能。