Gemini Imagen 3.0 MCP Server

Gemini Imagen 3.0 MCP Server

falahgs

开发者工具
访问服务器

README

Gemini Imagen 3.0 MCP 服务器

License Node TypeScript

一个专业的模型上下文协议 (MCP) 服务器实现,通过 Gemini API 利用 Google 的 Imagen 3.0 模型进行高质量图像生成。 使用 TypeScript 构建,旨在与 Claude Desktop 和其他 MCP 兼容的主机无缝集成。

🌟 特性

  • 通过 Gemini API 利用 Google 最先进的 Imagen 3.0 模型
  • 每个请求最多生成 4 张高质量图像
  • 具有智能命名的自动文件管理
  • 支持 file:// 协议的 HTML 预览生成
  • 基于 MCP 协议,实现 AI 代理兼容性
  • 使用强大的错误处理的 TypeScript 实现

🚀 快速开始

前提条件

  • Node.js 18 或更高版本
  • Google Gemini API 密钥
  • Claude Desktop 或另一个 MCP 兼容的主机

安装

  1. 克隆存储库:
git clone https://github.com/yourusername/gemini-imagen-mcp-server.git
cd gemini-imagen-mcp-server
  1. 安装依赖项:
npm install
  1. 构建 TypeScript 代码:
npm run build

⚙️ 配置

  1. 通过添加到 claude_desktop_config.json 来配置 Claude Desktop:
{
  "mcpServers": {
    "gemini-image-gen": {
      "command": "node",
      "args": ["./build/index.js"],
      "cwd": "<项目目录的路径>",
      "env": {
        "GEMINI_API_KEY": "你的-gemini-api-密钥"
      }
    }
  }
}
  1. 替换占位符:
    • <项目目录的路径>:你的项目路径
    • 你的-gemini-api-密钥:你的 Gemini API 密钥

🛠️ 可用工具

1. generate_images

使用 Google 的 Imagen 3.0 模型生成图像。

参数:

  • prompt (必需): 要生成的图像的文本描述
  • numberOfImages (可选): 图像数量 (1-4, 默认: 1)

文件管理:

  • 图像自动保存在 G:\image-gen3-google-mcp-server\images
  • 文件名遵循模式:{sanitized-prompt}-{timestamp}-{index}.png
  • 时间戳确保唯一的文件名
  • 提示经过清理,以确保安全的文件系统使用

示例:

生成一张夜晚未来城市的图像

2. create_image_html

为生成的图像创建 HTML 预览标签。

参数:

  • imagePaths (必需): 图像文件路径数组
  • width (可选): 图像宽度(像素)(默认:512)
  • height (可选): 图像高度(像素)(默认:512)

返回带有绝对 file:// URL 的 HTML 标签,用于本地查看。

示例:

为生成的图像创建宽度=400 的 HTML 标签

🔧 开发

# 安装依赖项
npm install

# 构建 TypeScript
npm run build

# 运行测试(如果可用)
npm test

🤝 贡献

欢迎贡献! 请随时提交 Pull Request。 对于重大更改:

  1. Fork 存储库
  2. 创建你的功能分支 (git checkout -b feature/AmazingFeature)
  3. 提交你的更改 (git commit -m 'Add some AmazingFeature')
  4. 推送到分支 (git push origin feature/AmazingFeature)
  5. 打开一个 Pull Request

📝 错误处理

服务器实现了两个主要的错误代码:

  • tool_not_found (1): 当请求的工具不可用时
  • execution_error (2): 当图像生成或 HTML 创建失败时

📄 许可证

MIT 许可证 - 有关详细信息,请参阅 LICENSE 文件。

✨ 作者

Falah G. Salieh

🙏 鸣谢

  • Google Gemini API 和 Imagen 3.0 模型
  • Anthropic 的模型上下文协议 (MCP)
  • Claude Desktop 团队的 MCP 主机实现

📌 标签

#MCP #Gemini #Imagen3 #AI #ImageGeneration #TypeScript #NodeJS #GoogleAI #ClaudeDesktop


用 ❤️ 由 Falah G. Salieh 制作

推荐服务器

Playwright MCP Server

Playwright MCP Server

一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。

官方
精选
TypeScript
Magic Component Platform (MCP)

Magic Component Platform (MCP)

一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。

官方
精选
本地
TypeScript
MCP Package Docs Server

MCP Package Docs Server

促进大型语言模型高效访问和获取 Go、Python 和 NPM 包的结构化文档,通过多语言支持和性能优化来增强软件开发。

精选
本地
TypeScript
Claude Code MCP

Claude Code MCP

一个实现了 Claude Code 作为模型上下文协议(Model Context Protocol, MCP)服务器的方案,它可以通过标准化的 MCP 接口来使用 Claude 的软件工程能力(代码生成、编辑、审查和文件操作)。

精选
本地
JavaScript
@kazuph/mcp-taskmanager

@kazuph/mcp-taskmanager

用于任务管理的模型上下文协议服务器。它允许 Claude Desktop(或任何 MCP 客户端)在基于队列的系统中管理和执行任务。

精选
本地
JavaScript
mermaid-mcp-server

mermaid-mcp-server

一个模型上下文协议 (MCP) 服务器,用于将 Mermaid 图表转换为 PNG 图像。

精选
JavaScript
Jira-Context-MCP

Jira-Context-MCP

MCP 服务器向 AI 编码助手(如 Cursor)提供 Jira 工单信息。

精选
TypeScript
Linear MCP Server

Linear MCP Server

一个模型上下文协议(Model Context Protocol)服务器,它与 Linear 的问题跟踪系统集成,允许大型语言模型(LLM)通过自然语言交互来创建、更新、搜索和评论 Linear 问题。

精选
JavaScript
Sequential Thinking MCP Server

Sequential Thinking MCP Server

这个服务器通过将复杂问题分解为顺序步骤来促进结构化的问题解决,支持修订,并通过完整的 MCP 集成来实现多条解决方案路径。

精选
Python
Curri MCP Server

Curri MCP Server

通过管理文本笔记、提供笔记创建工具以及使用结构化提示生成摘要,从而实现与 Curri API 的交互。

官方
本地
JavaScript