Doubao Image/Video Generation MCP Server
Enables AI image generation using Doubao Seedream models and video generation using Doubao Seedance models through Volcano Engine's API, supporting text-to-image, image-to-image, text-to-video, and task status queries.
README
豆包图片/视频生成 MCP 服务器
一个支持豆包图片生成和视频生成的 MCP (Model Context Protocol) 服务器
功能
- 图片生成: 使用豆包 Seedream 模型生成高质量图片
- 视频生成: 使用豆包 Seedance 模型生成视频
- 任务查询: 查询视频生成任务状态
获取 API Key
- 访问 火山引擎豆包大模型平台
- 注册/登录账号
- 在控制台获取 API Key
创建推理接入点
- 访问 火山引擎控制台
- 进入「开通管理」页面,参与「协作奖励计划」享免费资源包
- 授权图片生成接入点(Doubao-Seedream-4.5 模型)
- 授权视频生成接入点(Doubao-Seedance-1.0-lite-t2v 模型)
- 进入「安全管理」页面,点击内容安全,复制接入点 ID 到配置文件
PS: 图像生成和视频生成配置不同的接入点
安装
本地安装
cd doubao-image-video-mcp
pnpm install
pnpm build
配置
Claude Code 中使用 (推荐)
在 Claude Code 配置文件中添加:
macOS/Linux: ~/.claude/config.json
Windows: %APPDATA%\claude\config.json
{
"mcpServers": {
"doubao-giv": {
"command": "npx",
"args": ["-y", "doubao-image-video-mcp@latest"],
"env": {
"DOUBAO_API_KEY": "your_api_key_here",
"DOUBAO_IMAGE_ENDPOINT_ID": "ep-20241227-xxxxxxxxxxxxx",
"DOUBAO_VIDEO_ENDPOINT_ID": "ep-20241227-xxxxxxxxxxxxx"
}
}
}
}
通用 MCP 客户端配置
{
"mcpServers": {
"doubao-giv": {
"command": "npx",
"args": ["-y", "doubao-image-video-mcp@latest"],
"env": {
"DOUBAO_API_KEY": "your_api_key_here",
"DOUBAO_IMAGE_ENDPOINT_ID": "ep-20241227-xxxxxxxxxxxxx",
"DOUBAO_VIDEO_ENDPOINT_ID": "ep-20241227-xxxxxxxxxxxxx"
}
}
}
}
使用
npx -y可以自动安装最新版本,无需手动管理本地文件。
本地开发配置
如果从源码运行:
{
"mcpServers": {
"doubao-giv": {
"command": "node",
"args": ["/absolute/path/to/doubao-image-video-mcp/dist/index.js"],
"env": {
"DOUBAO_API_KEY": "your_api_key_here",
"DOUBAO_IMAGE_ENDPOINT_ID": "ep-20241227-xxxxxxxxxxxxx",
"DOUBAO_VIDEO_ENDPOINT_ID": "ep-20241227-xxxxxxxxxxxxx"
}
}
}
}
环境变量
| 环境变量 | 必需 | 默认值 | 说明 |
|---|---|---|---|
DOUBAO_API_KEY |
✅ | - | API 密钥 |
DOUBAO_IMAGE_ENDPOINT_ID |
✅ | - | 图片生成推理接入点 ID |
DOUBAO_VIDEO_ENDPOINT_ID |
✅ | - | 视频生成推理接入点 ID |
DOUBAO_DEFAULT_IMAGE_MODEL |
❌ | doubao-seedream-4-5 |
默认图片生成模型 |
DOUBAO_DEFAULT_VIDEO_MODEL |
❌ | doubao-seedance-1.0-lite-t2v |
默认视频生成模型 |
重要:必须在火山引擎控制台创建推理接入点并配置接入点 ID,直接使用模型名称可能因权限问题导致调用失败。
支持的工具
1. generate_image
生成单张图片。
参数:
prompt(必需): 图片描述文本model(可选): 模型选择,默认doubao-seedream-4-5size(可选): 图片尺寸,默认1024x1024image_url(可选): 参考图片 URL (图生图)ref_image_urls(可选): 多张参考图片 URL 数组 (多图融合)req_key(可选): 请求标识
2. generate_video
生成视频(异步任务)。
参数:
prompt(必需): 视频描述文本 (最大 500 字符)model(可选): 模型选择,默认doubao-seedance-1.0-lite-t2vvideo_duration(可选): 视频时长 (秒),默认 5fps(可选): 帧率,默认 24resolution(可选): 分辨率,默认1080pfirst_frame_image_url(可选): 首帧图片 URL (图生视频)ref_image_urls(可选): 参考图片 URL 数组req_key(可选): 请求标识
返回: 任务 ID,需要使用 query_video_task 查询结果
3. query_video_task
查询视频生成任务状态。
参数:
task_id(必需): 视频生成任务 ID
返回: 任务状态和结果
支持的模型
图片生成模型
| 模型 | 说明 |
|---|---|
doubao-seedream-4-5 |
最新 4.0 模型,支持 4K 分辨率 |
doubao-seedream-3-0-t2i |
3.0 文生图模型 |
视频生成模型
| 模型 | 说明 |
|---|---|
doubao-seedance-1.0-pro |
专业版,高质量视频生成 |
doubao-seedance-1.0-pro-fast |
专业版快速生成 |
doubao-seedance-1.0-lite-t2v |
轻量版,快速生成 |
API 文档
常见问题
Q: 视频生成需要多长时间?
A: 视频生成是异步任务,通常需要几秒到几分钟,具体取决于视频时长和模型选择。
Q: 如何获取推理接入点 Endpoint ID?
A: 在火山引擎控制台创建推理接入点后获取,使用 endpoint_id 参数比直接使用 model 名称更稳定。
Q: 支持哪些图片尺寸?
A: 图片生成支持多种尺寸,推荐使用 1920x2160、1920x2560、2160x3840 等高分辨率尺寸(豆包 API 要求图片至少 3686400 像素)。
参与贡献
欢迎提交 Issue 和 Pull Request!
- Fork 本仓库
- 创建特性分支 (
git checkout -b feature/AmazingFeature) - 提交更改 (
git commit -m 'Add some AmazingFeature') - 推送到分支 (
git push origin feature/AmazingFeature) - 开启 Pull Request
贡献指南
- 遵循现有代码风格
- 添加必要的测试和文档
- 提交前运行
pnpm build确保构建成功
发布流程
项目使用 GitHub Actions 自动发布到 npm:
- 更新
package.json中的版本号 - 创建并推送 Git 标签:
git tag v1.0.0 git push origin v1.0.0 - GitHub Actions 自动构建并发布到 npm
Star 历史
License
如果这个项目对你有帮助,请给一个 Star ⭐️
推荐服务器
Baidu Map
百度地图核心API现已全面兼容MCP协议,是国内首家兼容MCP协议的地图服务商。
Playwright MCP Server
一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。
Magic Component Platform (MCP)
一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。
Audiense Insights MCP Server
通过模型上下文协议启用与 Audiense Insights 账户的交互,从而促进营销洞察和受众数据的提取和分析,包括人口统计信息、行为和影响者互动。
VeyraX
一个单一的 MCP 工具,连接你所有喜爱的工具:Gmail、日历以及其他 40 多个工具。
graphlit-mcp-server
模型上下文协议 (MCP) 服务器实现了 MCP 客户端与 Graphlit 服务之间的集成。 除了网络爬取之外,还可以将任何内容(从 Slack 到 Gmail 再到播客订阅源)导入到 Graphlit 项目中,然后从 MCP 客户端检索相关内容。
Kagi MCP Server
一个 MCP 服务器,集成了 Kagi 搜索功能和 Claude AI,使 Claude 能够在回答需要最新信息的问题时执行实时网络搜索。
e2b-mcp-server
使用 MCP 通过 e2b 运行代码。
Neon MCP Server
用于与 Neon 管理 API 和数据库交互的 MCP 服务器
Exa MCP Server
模型上下文协议(MCP)服务器允许像 Claude 这样的 AI 助手使用 Exa AI 搜索 API 进行网络搜索。这种设置允许 AI 模型以安全和受控的方式获取实时的网络信息。