Stability AI MCP Server
一个 MCP 服务器,集成了 Stability AI 的 API,提供高质量的图像生成、编辑和处理能力,包括背景移除、外绘、搜索和替换以及放大。
Tools
stability-ai-generate-image
Generate an image of anything based on a provided prompt.
stability-ai-generate-image-sd35
Generate an image using Stable Diffusion 3.5 models with advanced configuration options.
stability-ai-remove-background
Remove the background from an image.
stability-ai-outpaint
Extends an image in any direction while maintaining visual consistency.
stability-ai-search-and-replace
Replace objects or elements in an image by describing what to replace and what to replace it with.
stability-ai-upscale-fast
Cheap and fast tool to enhance image resolution by 4x.
stability-ai-upscale-creative
Enhance image resolution up to 4K using AI with creative interpretation. This tool works best on highly degraded images and performs heavy reimagining. In general, don't use this (expensive) tool unless specifically asked to do so, usually after trying stability-ai-upscale-fast first.
stability-ai-control-sketch
Translate hand-drawn sketches to production-grade images.
stability-ai-0-list-resources
Use this to check for files before deciding you don't have access to a file or image or resource. It pulls in a list of all of user's available Resources (i.e. image files and their URI's) so we can reference pre-existing images to manipulate or upload to Stability AI.
stability-ai-search-and-recolor
Search and recolor object(s) in an image
stability-ai-replace-background-and-relight
Replace background and adjust lighting of an image
stability-ai-control-style
Generate a new image in the style of a reference image
stability-ai-control-structure
Generate a new image while maintaining the structure of a reference image
README
<div align="center"> <h1><img src="https://github.com/tadasant/mcp-server-stability-ai/blob/main/images/mcp-server-stability-ai-logo.png" width="160px"><br/>Stability AI MCP 服务器</h1> <img src="https://img.shields.io/github/license/tadasant/mcp-server-stability-ai?style=flat-square&color=purple"/> <img src="https://img.shields.io/npm/v/mcp-server-stability-ai?style=flat-square&color=blue"/> <a href="https://smithery.ai/server/mcp-server-stability-ai"><img alt="Smithery Badge" src="https://smithery.ai/badge/mcp-server-stability-ai"></a> </div>
<br/>
还没听说过 MCP 吗? 了解最新信息的最好方法是阅读我们的 PulseMCP 每周新闻通讯。
这是一个 MCP (模型上下文协议) 服务器,它将 MCP 客户端与 Stability AI 最新的 Stable Diffusion 图像处理功能集成在一起:生成、编辑、放大等等。
Stability AI 是一家领先的 AI 模型提供商,此服务器直接连接到他们的 托管 REST API。 您需要注册一个 来自 stability.ai 的 API 密钥 才能开始使用。
他们免费提供 25 个积分。 之后,按需付费定价 非常合理:0.01 美元/积分,其中 3 个积分可让您在其核心模型上生成图像。 因此,100 张高质量图像 = 仅需 3 美元。
本项目与 Stability AI 官方无关。
演示视频,以及一个预告片:
<div style="display: flex; flex-direction: row;"> <img src="https://github.com/tadasant/mcp-server-stability-ai/blob/main/images/teaser-1.png" style="width: 48%;" /> <img src="https://github.com/tadasant/mcp-server-stability-ai/blob/main/images/teaser-2.png" style="width: 48%;" /> </div>
<br/>
目录
亮点
无需学习曲线:此服务器旨在采用合理的默认设置,并为与生成和处理图像文件相关的最常见操作提供简单、流畅的 UX。 您无需具备技术知识或了解任何关于图像模型的内容即可有效地使用它。
链式操作:您可以生成图像,然后替换其中的一个项目,然后删除背景...所有这些都在一次 Claude 对话中完成。
最小配置:您开始使用所需的只是一个 Stability AI API 密钥。 设置该密钥的环境变量和一个本地目录路径来存储输出图像,您就可以开始了。
利用一流的图像模型:Stability AI 是通过 API 公开的图像模型的领先提供商。 使用此服务器将它们集成到 Claude 或其他 MCP 客户端中 - 远胜于在 ChatGPT 中使用 DALL-E 模型之类的体验。
功能
此服务器已在 macOS 上使用 Claude Desktop 构建和测试。 它也应该与其他 MCP 客户端一起使用。
工具名称 | 描述 | 估计的 Stability API 成本 |
---|---|---|
generate-image |
根据提供的提示和其他可选参数生成任何事物的高质量图像。 | $0.03 |
generate-image-sd35 |
使用具有高级配置选项的 Stable Diffusion 3.5 模型生成图像。 | $0.04-$0.07 |
remove-background |
从图像中删除背景。 | $0.02 |
outpaint |
在保持视觉一致性的同时,在任何方向上扩展图像。 | $0.04 |
search-and-replace |
通过描述要替换的内容以及要替换成的内容来替换图像中的对象或元素。 | $0.04 |
upscale-fast |
将图像分辨率提高 4 倍。 | $0.01 |
upscale-creative |
将图像分辨率提高到 4K。 | $0.25 |
control-sketch |
将手绘草图转换为生产级图像。 | $0.03 |
control-style |
生成具有参考图像风格的图像。 | $0.04 |
control-structure |
生成图像,同时保持参考图像的结构。 | $0.03 |
replace-background-and-relight |
替换图像的背景并重新照明。 | $0.08 |
search-and-recolor |
搜索并重新着色图像中的对象。 | $0.05 |
使用技巧
- 所有处理过的图像都会自动保存到
IMAGE_STORAGE_DIRECTORY
,打开以供预览,并作为资源提供 - 不要 尝试复制/粘贴或上传图像文件到 Claude。 Claude 不会将图像存储在任何地方,因此我们无法使用 MCP 服务器处理这些图像。 它们必须“上传”(保存到)
IMAGE_STORAGE_DIRECTORY
,然后它们才会显示为聊天中可用的资源。 - 您可以使用预加载的提示,而不是编写自己的措辞:
<img src="https://github.com/tadasant/mcp-server-stability-ai/blob/main/images/prompts.png" width="500" alt="Prompts">
示例
生成图像
生成一张猫的图像
生成一张赛博朋克城市中猫的逼真图像,霓虹灯反射在它的皮毛上,16:9 宽高比
生成一张详细的数字艺术作品,一只猫穿着太空服漂浮在色彩缤纷的星云中,风格预设:数字艺术,宽高比:21:9
使用 SD3.5 生成图像
使用 SD3.5 模型生成一张带有电子狼耳朵的女性图像,风格预设为“霓虹朋克”
使用 SD3.5 Large Turbo 模型生成一张未来城市的图像,宽高比为 16:9
使用 SD3.5 Large 模型生成一张火星宇航员的图像,cfg 比例为 7.5,“模拟胶片”风格预设,种子为 42
删除背景
删除我刚刚生成的图像的背景
删除 product-photo.jpg 的背景,以便为我的电子商务网站做准备
删除 group-photo.png 的背景,以便我可以将其与另一张图像合成
外绘(取消裁剪)
将 vacation-photo.jpg 向右扩展 500 像素,以包含更多的海滩
将 family-portrait.png 向上扩展 300 像素以显示更多的山脉,并向右扩展 200 像素以包含更多的景观
在所有方向上扩展 artwork.png,以创建一个更宽广的奇幻森林场景,与原始环境相匹配
搜索和替换
在我上一张图像中,将红色汽车替换为蓝色汽车
在 portrait.png 中,将纯色背景替换为山脉上的日落
在 landscape.jpg 中,将现代建筑替换为维多利亚时代的建筑,同时保持相同的氛围
放大
放大 profile-pic.jpg 以获得更好的分辨率
放大 product-photo.png 以使其可以打印
然后,如果输出仍然不够好,您可以再次放大它:
再次尝试,质量更好
控制草图
将 sketch.png 转换为儿童读物的彩色插图
将 wireframe.jpg 转换为现代建筑可视化的详细 3D 渲染
控制风格
生成具有参考图像风格的图像
控制结构
生成图像,同时保持参考图像的结构
替换背景并重新照明
将我刚刚生成的图像的背景替换为山脉上的日落
搜索和重新着色
在我上一张图像中,将红色汽车改为蓝色
设置
速查表
环境变量 | 描述 | 必需 | 默认值 | 示例 |
---|---|---|---|---|
STABILITY_AI_API_KEY |
您的 Stability AI API 密钥。 在 platform.stability.ai 获取一个 | 是 | N/A | sk-1234567890 |
IMAGE_STORAGE_DIRECTORY |
将生成的图像保存到的目录 | 否 | /tmp/tadasant-mcp-server-stability-ai OR C:\\Windows\\Temp\\mcp-server-stability-ai |
/Users/admin/Downloads/stability-ai-images |
GCS_PROJECT_ID |
用于存储图像的 Google Cloud 项目 ID | 否 (如果使用 SSE,则为是) | N/A | your-project-id |
GCS_CLIENT_EMAIL |
用于存储图像的 Google Cloud Service Account 客户端电子邮件 | 否 (如果使用 SSE,则为是) | N/A | your-service-account@project.iam.gserviceaccount.com |
GCS_PRIVATE_KEY |
用于存储图像的 Google Cloud Service Account 私钥 | 否 (如果使用 SSE,则为是) | N/A | -----BEGIN PRIVATE KEY-----\nYourKeyHere\n-----END PRIVATE KEY-----\n |
GCS_BUCKET_NAME |
用于存储图像的 Google Cloud Storage 存储桶名称 | 否 (如果使用 SSE,则为是) | N/A | your-bucket-name |
Claude Desktop
如果您喜欢视频教程,请观看 这个快速教程。
在您的机器上的某个位置创建一个文件夹目录,以存储生成/修改的图像。 一些选项:
/Users/<username>/Downloads/stability-ai-images
/Users/<username>/Library/Application Support/Claude/mcp-server-stability-ai/images
并确保您拥有 来自 Stability AI 的 API 密钥。
然后继续使用您首选的配置服务器的方法。 如果这是您第一次使用 MCP 服务器,您需要确保您拥有 Claude Desktop 应用程序 并按照 官方 MCP 设置说明 进行操作。
手动设置
您需要在您的机器上运行 Node,以便您可以在终端中运行 npx
命令。 如果您没有 Node,您可以从 nodejs.org 安装它。
macOS: ~/Library/Application Support/Claude/claude_desktop_config.json
Windows: %APPDATA%\Claude\claude_desktop_config.json
修改您的 claude_desktop_config.json
文件以添加以下内容:
{
"mcpServers": {
"stability-ai": {
"command": "npx",
"args": [
"-y",
"mcp-server-stability-ai"
],
"env": {
"STABILITY_AI_API_KEY": "sk-1234567890"
}
}
}
}
重新启动 Claude Desktop,您应该就可以开始了:
<img src="https://github.com/tadasant/mcp-server-stability-ai/blob/main/images/claude-1.png" width="500" alt="Claude First Image">
<img src="https://github.com/tadasant/mcp-server-stability-ai/blob/main/images/claude-2.png" width="500" alt="Claude Second Image">
通过 Smithery 安装
要通过 Smithery 自动为 Claude Desktop 安装:
npx @smithery/cli install mcp-server-stability-ai --client claude
SSE 模式
此服务器可以选择以 SSE 模式运行,方法是使用以下命令启动它:
npx mcp-server-stability-ai -y --sse
如果您打算通过 HTTP 为第三方部署此服务器,则此模式非常有用。
您需要设置 GCS_PROJECT_ID
、GCS_CLIENT_EMAIL
、GCS_BUCKET_NAME
和 GCS_PRIVATE_KEY
环境变量,因为服务器会将图像文件存储在 Google Cloud Storage 中,而不是其本地文件系统中。
请注意,多租户的方案非常简单且不安全:它使用请求者的 IP 地址来分割用于存储图像的 GCS 前缀,并使所有图像都可以公开访问,以便将它们传回 MCP 客户端。 因此,从理论上讲,如果有人知道您的 IP 地址以及您生成的文件名,他们可以通过猜测 URL 来访问您的图像。
路线图
最近完成:
- ✅ 添加了对最新 Stable Diffusion 3.5 模型 的支持
这些即将推出; 但欢迎 PR! 请参阅 CONTRIBUTING.md。
inpaint
- 一个更精确的search-and-x
功能版本,需要管理一个蒙版来定义要替换的区域。- 基本图像处理(裁剪、旋转、调整大小等):可能作为其自己的 MCP 服务器
- 将一张图像绘制到另一张图像中的能力。 Stability API 似乎不可能实现; 可能需要另一个 MCP 服务器来访问不同的 API 来完成此操作。
- 专为图像处理定制的 MCP 客户端
贡献
欢迎外部贡献! 有关更多详细信息,请参阅 CONTRIBUTING.md。
也请随时提出问题或功能请求; 很高兴看到人们如何使用它以及如何使其变得更好。
推荐服务器
Magic Component Platform (MCP)
一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。
@kazuph/mcp-fetch
用于获取网页内容和处理图像的模型上下文协议服务器。这使得 Claude Desktop(或任何 MCP 客户端)能够适当地获取网页内容和处理图像。
mermaid-mcp-server
一个模型上下文协议 (MCP) 服务器,用于将 Mermaid 图表转换为 PNG 图像。
mcp-pinterest
用于图像搜索和信息检索的 Pinterest 模型上下文协议 (MCP) 服务器
DeepSRT MCP Server
一个 MCP 服务器,通过与 DeepSRT 的 API 集成,使用户能够以多种语言和格式生成 YouTube 视频的摘要。
ScreenshotOne MCP Server
一个官方的 MCP 服务器实现,它允许 AI 助手通过 ScreenshotOne API 捕获网站截图,从而在对话期间提供来自网页的视觉上下文。
Glif
通过 MCP 运行托管在 Glif.app 上的 AI 工作流程,包括基于 ComfyUI 的图像生成器、表情包生成器、自拍、链式 LLM 调用等等。
WebPerfect MCP Server
一个智能的MCP服务器,具有全自动化的批处理流水线,可用于生成适用于网络的图像。功能包括降噪、自动色阶/曲线、JPEG伪影去除、4K调整大小、智能锐化(带阴影/高光增强)以及高级WebP转换。
Stealth Browser MCP Server
使用 Playwright 提供隐身浏览器功能,采用反检测技术,使 MCP 客户端能够浏览网站并截取屏幕截图,同时规避常见的机器人检测系统。

Video Editor MCP Server
使用自然语言命令进行视频编辑,由 FFmpeg 提供支持,支持剪辑、合并、格式转换等操作,并具有实时进度跟踪和错误处理功能。