Gladia MCP
一个官方的模型上下文协议服务器,它支持与强大的语音转文本和音频智能API进行交互,从而允许像Claude Desktop这样的客户端转录音频、分析语音、翻译内容等等。
README
Gladia MCP
<div class="title-block" style="text-align: center;" align="center">
</div>
<p align="center"> 官方 Gladia <a href="https://github.com/modelcontextprotocol">模型上下文协议 (MCP)</a> 服务器,支持与强大的语音转文本和音频智能 API 进行交互。此服务器允许 MCP 客户端(如 <a href="https://www.anthropic.com/claude">Claude Desktop</a>、<a href="https://www.cursor.so">Cursor</a>、<a href="https://codeium.com/windsurf">Windsurf</a>、<a href="https://github.com/openai/openai-agents-python">OpenAI Agents</a> 等)转录音频、分析语音、翻译内容等。 </p>
功能
- 带有说话人区分的音频转录
- 实时语音转文本
- 音频智能功能:
- 翻译
- 摘要
- 命名实体识别
- 情感分析
- 内容审核
- 章节划分
- 音频到 LLM 集成
- 带有 FastAPI 的异步 API
- 易于使用的 CLI 界面
- 可配置的日志记录
- CORS 支持
- 健康检查端点
使用 Claude Desktop 快速开始
- 从 Gladia 获取您的 API 密钥。 提供免费套餐。
- 安装
uv(Python 包管理器),使用curl -LsSf https://astral.sh/uv/install.sh | sh安装,或查看uv仓库 获取其他安装方法。 - 转到 Claude > 设置 > 开发者 > 编辑配置 > claude_desktop_config.json,包含以下内容:
{
"mcpServers": {
"Gladia": {
"command": "uvx",
"args": ["gladia-mcp"],
"env": {
"GLADIA_API_KEY": "<在此处插入您的 API 密钥>"
}
}
}
}
如果您使用的是 Windows,则必须在 Claude Desktop 中启用“开发者模式”才能使用 MCP 服务器。 单击左上角汉堡菜单中的“帮助”,然后选择“启用开发者模式”。
其他 MCP 客户端
对于其他客户端(如 Cursor 和 Windsurf),请运行:
pip install gladia-mcppython -m gladia_mcp --api-key={{PUT_YOUR_API_KEY_HERE}} --print获取配置。 将其粘贴到 MCP 客户端指定的相应配置目录中。
使用示例
尝试询问 Claude:
- “转录此音频文件并识别不同的说话人”
- “将此录音转换为文本并将其翻译成西班牙语”
- “分析此语音中的情感和情绪”
- “从这个长音频文件中提取关键主题并创建章节”
- “转录此对话并总结要点”
可选功能
您可以添加 GLADIA_MCP_BASE_PATH 环境变量到 claude_desktop_config.json 中,以指定 MCP 服务器应查找和输出使用相对路径指定文件的基本路径。
贡献
如果您想贡献或从源代码运行:
- 克隆存储库:
git clone https://github.com/gladia/gladia-mcp
cd gladia-mcp
- 创建一个虚拟环境并安装依赖项 使用 uv:
uv venv
source .venv/bin/activate
uv pip install -e ".[dev]"
- 复制
.env.example到.env并添加您的 Gladia API 密钥:
cp .env.example .env
# 编辑 .env 并添加您的 API 密钥
- 运行测试以确保一切正常:
./scripts/test.sh
# 或使用选项
./scripts/test.sh --verbose --fail-fast
-
在 Claude Desktop 中安装服务器:
mcp install gladia_mcp/server.py -
使用 MCP Inspector 在本地调试和测试:
mcp dev gladia_mcp/server.py
API 端点
健康检查
GET /health
转录音频
POST /transcribe
参数:
file: 音频文件 (multipart/form-data)diarization: 启用说话人区分 (boolean, optional)language: 语言代码 (string, optional)
使用 curl 的示例:
curl -X POST "http://localhost:8000/transcribe" \
-H "accept: application/json" \
-H "Content-Type: multipart/form-data" \
-F "file=@audio.wav" \
-F "diarization=true"
故障排除
使用 Claude Desktop 运行时,日志位于:
- Windows:
%APPDATA%\Claude\logs\mcp-server-gladia.log - macOS:
~/Library/Logs/Claude/mcp-server-gladia.log
MCP Gladia: spawn uvx ENOENT
如果您遇到错误“MCP Gladia: spawn uvx ENOENT”,请通过在终端中运行以下命令来确认其绝对路径:
which uvx
获得绝对路径(例如,/usr/local/bin/uvx)后,更新您的配置以使用该路径(例如,"command": "/usr/local/bin/uvx")。 这确保引用了正确的执行文件。
开发
运行测试
pytest
代码风格
该项目遵循 PEP 8 风格指南。 使用 flake8 进行 linting:
flake8 gladia_mcp
许可证
MIT 许可证
推荐服务器
Baidu Map
百度地图核心API现已全面兼容MCP协议,是国内首家兼容MCP协议的地图服务商。
Playwright MCP Server
一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。
Magic Component Platform (MCP)
一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。
Audiense Insights MCP Server
通过模型上下文协议启用与 Audiense Insights 账户的交互,从而促进营销洞察和受众数据的提取和分析,包括人口统计信息、行为和影响者互动。
VeyraX
一个单一的 MCP 工具,连接你所有喜爱的工具:Gmail、日历以及其他 40 多个工具。
graphlit-mcp-server
模型上下文协议 (MCP) 服务器实现了 MCP 客户端与 Graphlit 服务之间的集成。 除了网络爬取之外,还可以将任何内容(从 Slack 到 Gmail 再到播客订阅源)导入到 Graphlit 项目中,然后从 MCP 客户端检索相关内容。
Kagi MCP Server
一个 MCP 服务器,集成了 Kagi 搜索功能和 Claude AI,使 Claude 能够在回答需要最新信息的问题时执行实时网络搜索。
e2b-mcp-server
使用 MCP 通过 e2b 运行代码。
Neon MCP Server
用于与 Neon 管理 API 和数据库交互的 MCP 服务器
Exa MCP Server
模型上下文协议(MCP)服务器允许像 Claude 这样的 AI 助手使用 Exa AI 搜索 API 进行网络搜索。这种设置允许 AI 模型以安全和受控的方式获取实时的网络信息。