
DALL-E MCP Server
一个 MCP 服务器,允许用户通过 OpenAI 的 DALL-E API 生成、编辑和创建图像的变体,同时支持 DALL-E 2 和 DALL-E 3 模型。
README
DALL-E MCP 服务器
<img src="assets/dall-e-logo.png" alt="DALL-E MCP Logo" width="256" height="256">
一个使用 OpenAI 的 DALL-E API 生成图像的 MCP (模型上下文协议) 服务器。
功能
- 使用 DALL-E 2 或 DALL-E 3 生成图像
- 编辑现有图像 (仅限 DALL-E 2)
- 创建现有图像的变体 (仅限 DALL-E 2)
- 验证 OpenAI API 密钥
安装
# 克隆仓库
git clone https://github.com/Garoth/dalle-mcp.git
cd dalle-mcp
# 安装依赖
npm install
# 构建项目
npm run build
Cline 用户的重要提示
当将此 DALL-E MCP 服务器与 Cline 一起使用时,建议通过设置 saveDir
参数以匹配您当前的工作目录,将生成的图像保存在您当前的工作区目录中。这确保 Cline 可以正确地定位并在您的对话中显示生成的图像。
与 Cline 一起使用的示例:
{
"prompt": "日落时分的热带海滩",
"saveDir": "/path/to/current/workspace"
}
用法
运行服务器
# 运行服务器
node build/index.js
Cline 的配置
将 dall-e 服务器添加到 VSCode 设置中的 Cline MCP 设置文件 (例如 ~/.config/Code/User/globalStorage/saoudrizwan.claude-dev/settings/cline_mcp_settings.json):
{
"mcpServers": {
"dalle-mcp": {
"command": "node",
"args": ["/path/to/dalle-mcp-server/build/index.js"],
"env": {
"OPENAI_API_KEY": "your-api-key-here",
"SAVE_DIR": "/path/to/save/directory"
},
"disabled": false,
"autoApprove": []
}
}
}
请确保:
- 将
/path/to/dalle-mcp-server/build/index.js
替换为构建后的 index.js 文件的实际路径 - 将
your-api-key-here
替换为您的 OpenAI API 密钥
可用工具
generate_image
使用 DALL-E 基于文本提示生成图像。
{
"prompt": "一个具有飞行汽车和霓虹灯的未来城市",
"model": "dall-e-3",
"size": "1024x1024",
"quality": "standard",
"style": "vivid",
"n": 1,
"saveDir": "/path/to/save/directory",
"fileName": "futuristic-city"
}
参数:
prompt
(必需): 所需图像的文本描述model
(可选): 要使用的 DALL-E 模型 ("dall-e-2" 或 "dall-e-3", 默认值: "dall-e-3")size
(可选): 生成图像的大小 (默认值: "1024x1024")- DALL-E 3: "1024x1024", "1792x1024", 或 "1024x1792"
- DALL-E 2: "256x256", "512x512", 或 "1024x1024"
quality
(可选): 生成图像的质量,仅限 DALL-E 3 ("standard" 或 "hd", 默认值: "standard")style
(可选): 生成图像的风格,仅限 DALL-E 3 ("vivid" 或 "natural", 默认值: "vivid")n
(可选): 要生成的图像数量 (1-10, 默认值: 1)saveDir
(可选): 保存生成图像的目录 (默认值: 当前目录或来自 .env 的 SAVE_DIR)。 对于 Cline 用户: 建议将此设置为您当前的工作区目录,以便正确显示图像。fileName
(可选): 生成图像的基本文件名,不带扩展名 (默认值: "dalle-{timestamp}")
edit_image
使用 DALL-E 基于文本提示编辑现有图像。
⚠️ 已知问题 (2025 年 3 月 18 日): DALL-E 2 图像编辑 API 目前存在一个错误,有时会忽略提示并返回原始图像,而不进行任何编辑,即使使用正确的 RGBA 格式图像和蒙版也是如此。 此问题已在 OpenAI 社区论坛 中报告。 如果您遇到此问题,请尝试使用
create_variation
工具,该工具似乎更可靠。
{
"prompt": "添加一顶红帽子",
"imagePath": "/path/to/image.png",
"mask": "/path/to/mask.png",
"model": "dall-e-2",
"size": "1024x1024",
"n": 1,
"saveDir": "/path/to/save/directory",
"fileName": "edited-image"
}
参数:
prompt
(必需): 所需编辑的文本描述imagePath
(必需): 要编辑的图像的路径mask
(可选): 蒙版图像的路径 (白色区域将被编辑,黑色区域将被保留)model
(可选): 要使用的 DALL-E 模型 (目前只有 "dall-e-2" 支持编辑, 默认值: "dall-e-2")size
(可选): 生成图像的大小 (默认值: "1024x1024")n
(可选): 要生成的图像数量 (1-10, 默认值: 1)saveDir
(可选): 保存编辑图像的目录 (默认值: 当前目录或来自 .env 的 SAVE_DIR)。 对于 Cline 用户: 建议将此设置为您当前的工作区目录,以便正确显示图像。fileName
(可选): 编辑图像的基本文件名,不带扩展名 (默认值: "dalle-edit-{timestamp}")
create_variation
使用 DALL-E 创建现有图像的变体。
{
"imagePath": "/path/to/image.png",
"model": "dall-e-2",
"size": "1024x1024",
"n": 4,
"saveDir": "/path/to/save/directory",
"fileName": "image-variation"
}
参数:
imagePath
(必需): 要创建变体的图像的路径model
(可选): 要使用的 DALL-E 模型 (目前只有 "dall-e-2" 支持变体, 默认值: "dall-e-2")size
(可选): 生成图像的大小 (默认值: "1024x1024")n
(可选): 要生成的变体数量 (1-10, 默认值: 1)saveDir
(可选): 保存变体图像的目录 (默认值: 当前目录或来自 .env 的 SAVE_DIR)。 对于 Cline 用户: 建议将此设置为您当前的工作区目录,以便正确显示图像。fileName
(可选): 变体图像的基本文件名,不带扩展名 (默认值: "dalle-variation-{timestamp}")
validate_key
验证 OpenAI API 密钥。
{}
无需参数。
开发
测试配置
注意:以下 .env 配置仅用于运行测试,不用于正常操作。
如果您正在开发或运行此项目的测试,请在根目录中创建一个包含您的 OpenAI API 密钥的 .env
文件:
# 仅测试需要: OpenAI API 密钥
OPENAI_API_KEY=your-api-key-here
# 可选: 测试图像的默认保存目录
# 如果未指定,图像将保存到当前目录
# SAVE_DIR=/path/to/save/directory
对于 Cline 的正常操作,请按照上述“添加到 MCP 设置”部分中的描述,在 MCP 设置 JSON 中配置您的 API 密钥。
您可以从 OpenAI 的 API 密钥页面 获取您的 API 密钥。
运行测试
# 运行基本测试
npm test
# 运行所有测试,包括编辑和变体测试
npm run test:all
# 在监视模式下运行测试
npm run test:watch
# 按名称运行特定测试
npm run test:name "should validate API key"
注意:测试使用真实的 API 调用,可能会在您的 OpenAI 帐户上产生费用。
生成测试图像
该项目包含一个用于生成用于开发和测试的测试图像的脚本:
# 在 assets 目录中生成一个测试图像
npm run generate-test-image
这将在 assets
目录中创建一个简单的测试图像,可用于测试编辑和变体功能。
许可证
MIT
推荐服务器

Baidu Map
百度地图核心API现已全面兼容MCP协议,是国内首家兼容MCP协议的地图服务商。
Playwright MCP Server
一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。
Magic Component Platform (MCP)
一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。
Audiense Insights MCP Server
通过模型上下文协议启用与 Audiense Insights 账户的交互,从而促进营销洞察和受众数据的提取和分析,包括人口统计信息、行为和影响者互动。

VeyraX
一个单一的 MCP 工具,连接你所有喜爱的工具:Gmail、日历以及其他 40 多个工具。
graphlit-mcp-server
模型上下文协议 (MCP) 服务器实现了 MCP 客户端与 Graphlit 服务之间的集成。 除了网络爬取之外,还可以将任何内容(从 Slack 到 Gmail 再到播客订阅源)导入到 Graphlit 项目中,然后从 MCP 客户端检索相关内容。
Kagi MCP Server
一个 MCP 服务器,集成了 Kagi 搜索功能和 Claude AI,使 Claude 能够在回答需要最新信息的问题时执行实时网络搜索。

e2b-mcp-server
使用 MCP 通过 e2b 运行代码。
Neon MCP Server
用于与 Neon 管理 API 和数据库交互的 MCP 服务器
Exa MCP Server
模型上下文协议(MCP)服务器允许像 Claude 这样的 AI 助手使用 Exa AI 搜索 API 进行网络搜索。这种设置允许 AI 模型以安全和受控的方式获取实时的网络信息。