MCP Visual Language
Enables intelligent image analysis using GLM-4.5V model, specializing in extracting and analyzing code from screenshots with support for file paths and clipboard input.
README
MCP 自动图片分析服务器
基于 GLM-4.5V 模型的 MCP (Model Context Protocol) 服务器,提供智能图片分析功能,支持文件路径和剪贴板两种输入方式。
功能特性
- 🤖 智能获取: 自动从文件路径或剪贴板获取图片
- 💻 代码内容提取: 从图片中提取代码文本
- 🏗️ 架构分析: 分析代码的结构和设计模式
- 🐛 错误检测: 识别代码中的错误和问题
- 📚 文档生成: 自动生成代码文档
- 🔍 语言识别: 自动识别编程语言
- 🎯 专注代码: 专门优化用于代码图片分析
技术栈
- 运行时: Node.js 18+
- 框架: TypeScript
- 模型: GLM-4.5V (智谱 AI)
- 图片处理: Sharp
- 协议: MCP (Model Context Protocol)
安装配置
1. 安装依赖
pnpm install
2. 配置环境变量
复制 .env.example 为 .env 并填入配置:
cp .env.example .env
编辑 .env 文件:
# 智谱 AI API 配置
ZHIPUAI_API_KEY=your_zhipuai_api_key_here
ZHIPUAI_BASE_URL=https://open.bigmodel.cn/api/paas/v4
# MCP 服务器配置
MCP_SERVER_NAME=mcp-vl
MCP_SERVER_VERSION=1.0.0
# 日志级别
LOG_LEVEL=info
3. 获取智谱 AI API Key
- 访问 智谱 AI 开放平台
- 注册账号并创建 API Key
- 将 API Key 填入
.env文件
4. 构建项目
pnpm run build
使用方法
在 Claude Code 中配置
方式一:使用 claude mcp add 命令(推荐)
构建项目后,使用以下命令添加 MCP 服务器:
claude mcp add mcp-vl --scope user --env ZHIPUAI_API_KEY=your_api_key_here \
-- node /path/mcp-vl/dist/index.js
方式二:手动配置
将以下配置添加到你的 Claude Code 配置中:
{
"mcpServers": {
"mcp-vl": {
"command": "node",
"args": ["/path/mcp-vl/dist/index.js"],
"env": {
"ZHIPUAI_API_KEY": "your_api_key_here"
}
}
}
}
Claude 提示词
## ⚠️ 图片处理规范 - 非常重要,一定要严格执行
**重要提示:在 Claude 中使用时,禁止使用 read 工具进行读取图片,因为读取图片工具失效了。请使用 mcp-vl 里的 auto_analyze_image 工具进行读取。**
可用工具
auto_analyze_image
自动获取并分析图片(支持文件路径或剪贴板)
{
"name": "auto_analyze_image",
"arguments": {
"imagePath": "/path/to/image.png", // 可选,不提供则使用剪贴板
"focusArea": "code" // "code", "architecture", "error", "documentation"
}
}
使用方式:
- 文件路径: 提供图片文件路径进行分析
- 剪贴板: 不提供路径,自动从剪贴板获取图片
分析类型说明:
code: 提取代码内容,识别编程语言,分析代码结构architecture: 分析代码架构设计,模块关系,设计模式error: 检查代码错误,性能问题,安全隐患documentation: 生成代码文档,函数说明,使用示例
开发
开发模式运行
pnpm run dev
构建项目
pnpm run build
代码检查
pnpm run lint
pnpm run typecheck
项目结构
src/
├── index.ts # MCP 服务器主入口
├── config/
│ └── index.ts # 配置管理
├── services/
│ ├── glm-service.ts # GLM 模型服务
│ └── auto-image-service.ts # 自动图片分析服务
├── types/
│ └── index.ts # TypeScript 类型定义
└── utils/
└── logger.ts # 日志工具
scripts/
└── test-local.ts # 本地测试脚本
注意事项
- API Key 安全: 请妥善保管你的智谱 AI API Key
- 代码图片优化: 专门针对代码截图优化,建议使用清晰的代码截图
- 支持格式: JPEG, PNG, WebP, GIF 等常见格式
- 网络连接: 需要稳定的网络连接访问智谱 AI API
- 最佳实践:
- 使用高对比度的代码编辑器主题
- 确保代码字体清晰可见
- 避免截图过大或过小
许可证
MIT License
贡献
欢迎提交 Issue 和 Pull Request!
推荐服务器
Baidu Map
百度地图核心API现已全面兼容MCP协议,是国内首家兼容MCP协议的地图服务商。
Playwright MCP Server
一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。
Magic Component Platform (MCP)
一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。
Audiense Insights MCP Server
通过模型上下文协议启用与 Audiense Insights 账户的交互,从而促进营销洞察和受众数据的提取和分析,包括人口统计信息、行为和影响者互动。
VeyraX
一个单一的 MCP 工具,连接你所有喜爱的工具:Gmail、日历以及其他 40 多个工具。
graphlit-mcp-server
模型上下文协议 (MCP) 服务器实现了 MCP 客户端与 Graphlit 服务之间的集成。 除了网络爬取之外,还可以将任何内容(从 Slack 到 Gmail 再到播客订阅源)导入到 Graphlit 项目中,然后从 MCP 客户端检索相关内容。
Kagi MCP Server
一个 MCP 服务器,集成了 Kagi 搜索功能和 Claude AI,使 Claude 能够在回答需要最新信息的问题时执行实时网络搜索。
e2b-mcp-server
使用 MCP 通过 e2b 运行代码。
Neon MCP Server
用于与 Neon 管理 API 和数据库交互的 MCP 服务器
Exa MCP Server
模型上下文协议(MCP)服务器允许像 Claude 这样的 AI 助手使用 Exa AI 搜索 API 进行网络搜索。这种设置允许 AI 模型以安全和受控的方式获取实时的网络信息。