Doubao Image/Video Generation MCP Server

Doubao Image/Video Generation MCP Server

Enables AI image generation using Doubao Seedream models and video generation using Doubao Seedance models through Volcano Engine's API, supporting text-to-image, image-to-image, text-to-video, and task status queries.

Category
访问服务器

README

豆包图片/视频生成 MCP 服务器

一个支持豆包图片生成和视频生成的 MCP (Model Context Protocol) 服务器

npm version License: MIT

功能

  • 图片生成: 使用豆包 Seedream 模型生成高质量图片
  • 视频生成: 使用豆包 Seedance 模型生成视频
  • 任务查询: 查询视频生成任务状态

获取 API Key

  1. 访问 火山引擎豆包大模型平台
  2. 注册/登录账号
  3. 在控制台获取 API Key

创建推理接入点

  1. 访问 火山引擎控制台
  2. 进入「开通管理」页面,参与「协作奖励计划」享免费资源包
  3. 授权图片生成接入点(Doubao-Seedream-4.5 模型)
  4. 授权视频生成接入点(Doubao-Seedance-1.0-lite-t2v 模型)
  5. 进入「安全管理」页面,点击内容安全,复制接入点 ID 到配置文件

PS: 图像生成和视频生成配置不同的接入点

安装

本地安装

cd doubao-image-video-mcp
pnpm install
pnpm build

配置

Claude Code 中使用 (推荐)

在 Claude Code 配置文件中添加:

macOS/Linux: ~/.claude/config.json Windows: %APPDATA%\claude\config.json

{
  "mcpServers": {
    "doubao-giv": {
      "command": "npx",
      "args": ["-y", "doubao-image-video-mcp@latest"],
      "env": {
        "DOUBAO_API_KEY": "your_api_key_here",
        "DOUBAO_IMAGE_ENDPOINT_ID": "ep-20241227-xxxxxxxxxxxxx",
        "DOUBAO_VIDEO_ENDPOINT_ID": "ep-20241227-xxxxxxxxxxxxx"
      }
    }
  }
}

通用 MCP 客户端配置

{
  "mcpServers": {
    "doubao-giv": {
      "command": "npx",
      "args": ["-y", "doubao-image-video-mcp@latest"],
      "env": {
        "DOUBAO_API_KEY": "your_api_key_here",
        "DOUBAO_IMAGE_ENDPOINT_ID": "ep-20241227-xxxxxxxxxxxxx",
        "DOUBAO_VIDEO_ENDPOINT_ID": "ep-20241227-xxxxxxxxxxxxx"
      }
    }
  }
}

使用 npx -y 可以自动安装最新版本,无需手动管理本地文件。

本地开发配置

如果从源码运行:

{
  "mcpServers": {
    "doubao-giv": {
      "command": "node",
      "args": ["/absolute/path/to/doubao-image-video-mcp/dist/index.js"],
      "env": {
        "DOUBAO_API_KEY": "your_api_key_here",
        "DOUBAO_IMAGE_ENDPOINT_ID": "ep-20241227-xxxxxxxxxxxxx",
        "DOUBAO_VIDEO_ENDPOINT_ID": "ep-20241227-xxxxxxxxxxxxx"
      }
    }
  }
}

环境变量

环境变量 必需 默认值 说明
DOUBAO_API_KEY - API 密钥
DOUBAO_IMAGE_ENDPOINT_ID - 图片生成推理接入点 ID
DOUBAO_VIDEO_ENDPOINT_ID - 视频生成推理接入点 ID
DOUBAO_DEFAULT_IMAGE_MODEL doubao-seedream-4-5 默认图片生成模型
DOUBAO_DEFAULT_VIDEO_MODEL doubao-seedance-1.0-lite-t2v 默认视频生成模型

重要:必须在火山引擎控制台创建推理接入点并配置接入点 ID,直接使用模型名称可能因权限问题导致调用失败。

支持的工具

1. generate_image

生成单张图片。

参数:

  • prompt (必需): 图片描述文本
  • model (可选): 模型选择,默认 doubao-seedream-4-5
  • size (可选): 图片尺寸,默认 1024x1024
  • image_url (可选): 参考图片 URL (图生图)
  • ref_image_urls (可选): 多张参考图片 URL 数组 (多图融合)
  • req_key (可选): 请求标识

2. generate_video

生成视频(异步任务)。

参数:

  • prompt (必需): 视频描述文本 (最大 500 字符)
  • model (可选): 模型选择,默认 doubao-seedance-1.0-lite-t2v
  • video_duration (可选): 视频时长 (秒),默认 5
  • fps (可选): 帧率,默认 24
  • resolution (可选): 分辨率,默认 1080p
  • first_frame_image_url (可选): 首帧图片 URL (图生视频)
  • ref_image_urls (可选): 参考图片 URL 数组
  • req_key (可选): 请求标识

返回: 任务 ID,需要使用 query_video_task 查询结果

3. query_video_task

查询视频生成任务状态。

参数:

  • task_id (必需): 视频生成任务 ID

返回: 任务状态和结果

支持的模型

图片生成模型

模型 说明
doubao-seedream-4-5 最新 4.0 模型,支持 4K 分辨率
doubao-seedream-3-0-t2i 3.0 文生图模型

视频生成模型

模型 说明
doubao-seedance-1.0-pro 专业版,高质量视频生成
doubao-seedance-1.0-pro-fast 专业版快速生成
doubao-seedance-1.0-lite-t2v 轻量版,快速生成

API 文档

常见问题

Q: 视频生成需要多长时间?

A: 视频生成是异步任务,通常需要几秒到几分钟,具体取决于视频时长和模型选择。

Q: 如何获取推理接入点 Endpoint ID?

A: 在火山引擎控制台创建推理接入点后获取,使用 endpoint_id 参数比直接使用 model 名称更稳定。

Q: 支持哪些图片尺寸?

A: 图片生成支持多种尺寸,推荐使用 1920x21601920x25602160x3840 等高分辨率尺寸(豆包 API 要求图片至少 3686400 像素)。

参与贡献

欢迎提交 Issue 和 Pull Request!

  1. Fork 本仓库
  2. 创建特性分支 (git checkout -b feature/AmazingFeature)
  3. 提交更改 (git commit -m 'Add some AmazingFeature')
  4. 推送到分支 (git push origin feature/AmazingFeature)
  5. 开启 Pull Request

贡献指南

  • 遵循现有代码风格
  • 添加必要的测试和文档
  • 提交前运行 pnpm build 确保构建成功

发布流程

项目使用 GitHub Actions 自动发布到 npm:

  1. 更新 package.json 中的版本号
  2. 创建并推送 Git 标签:
    git tag v1.0.0
    git push origin v1.0.0
    
  3. GitHub Actions 自动构建并发布到 npm

Star 历史

Star History Chart

License

MIT


如果这个项目对你有帮助,请给一个 Star ⭐️

推荐服务器

Baidu Map

Baidu Map

百度地图核心API现已全面兼容MCP协议,是国内首家兼容MCP协议的地图服务商。

官方
精选
JavaScript
Playwright MCP Server

Playwright MCP Server

一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。

官方
精选
TypeScript
Magic Component Platform (MCP)

Magic Component Platform (MCP)

一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。

官方
精选
本地
TypeScript
Audiense Insights MCP Server

Audiense Insights MCP Server

通过模型上下文协议启用与 Audiense Insights 账户的交互,从而促进营销洞察和受众数据的提取和分析,包括人口统计信息、行为和影响者互动。

官方
精选
本地
TypeScript
VeyraX

VeyraX

一个单一的 MCP 工具,连接你所有喜爱的工具:Gmail、日历以及其他 40 多个工具。

官方
精选
本地
graphlit-mcp-server

graphlit-mcp-server

模型上下文协议 (MCP) 服务器实现了 MCP 客户端与 Graphlit 服务之间的集成。 除了网络爬取之外,还可以将任何内容(从 Slack 到 Gmail 再到播客订阅源)导入到 Graphlit 项目中,然后从 MCP 客户端检索相关内容。

官方
精选
TypeScript
Kagi MCP Server

Kagi MCP Server

一个 MCP 服务器,集成了 Kagi 搜索功能和 Claude AI,使 Claude 能够在回答需要最新信息的问题时执行实时网络搜索。

官方
精选
Python
e2b-mcp-server

e2b-mcp-server

使用 MCP 通过 e2b 运行代码。

官方
精选
Neon MCP Server

Neon MCP Server

用于与 Neon 管理 API 和数据库交互的 MCP 服务器

官方
精选
Exa MCP Server

Exa MCP Server

模型上下文协议(MCP)服务器允许像 Claude 这样的 AI 助手使用 Exa AI 搜索 API 进行网络搜索。这种设置允许 AI 模型以安全和受控的方式获取实时的网络信息。

官方
精选