Gladia MCP

Gladia MCP

一个官方的模型上下文协议服务器,它支持与强大的语音转文本和音频智能API进行交互,从而允许像Claude Desktop这样的客户端转录音频、分析语音、翻译内容等等。

Category
访问服务器

README

Gladia MCP

<div class="title-block" style="text-align: center;" align="center">

PyPI Tests

</div>

<p align="center"> 官方 Gladia <a href="https://github.com/modelcontextprotocol">模型上下文协议 (MCP)</a> 服务器,支持与强大的语音转文本和音频智能 API 进行交互。此服务器允许 MCP 客户端(如 <a href="https://www.anthropic.com/claude">Claude Desktop</a>、<a href="https://www.cursor.so">Cursor</a>、<a href="https://codeium.com/windsurf">Windsurf</a>、<a href="https://github.com/openai/openai-agents-python">OpenAI Agents</a> 等)转录音频、分析语音、翻译内容等。 </p>

功能

  • 带有说话人区分的音频转录
  • 实时语音转文本
  • 音频智能功能:
    • 翻译
    • 摘要
    • 命名实体识别
    • 情感分析
    • 内容审核
    • 章节划分
    • 音频到 LLM 集成
  • 带有 FastAPI 的异步 API
  • 易于使用的 CLI 界面
  • 可配置的日志记录
  • CORS 支持
  • 健康检查端点

使用 Claude Desktop 快速开始

  1. Gladia 获取您的 API 密钥。 提供免费套餐。
  2. 安装 uv (Python 包管理器),使用 curl -LsSf https://astral.sh/uv/install.sh | sh 安装,或查看 uv 仓库 获取其他安装方法。
  3. 转到 Claude > 设置 > 开发者 > 编辑配置 > claude_desktop_config.json,包含以下内容:
{
  "mcpServers": {
    "Gladia": {
      "command": "uvx",
      "args": ["gladia-mcp"],
      "env": {
        "GLADIA_API_KEY": "<在此处插入您的 API 密钥>"
      }
    }
  }
}

如果您使用的是 Windows,则必须在 Claude Desktop 中启用“开发者模式”才能使用 MCP 服务器。 单击左上角汉堡菜单中的“帮助”,然后选择“启用开发者模式”。

其他 MCP 客户端

对于其他客户端(如 Cursor 和 Windsurf),请运行:

  1. pip install gladia-mcp
  2. python -m gladia_mcp --api-key={{PUT_YOUR_API_KEY_HERE}} --print 获取配置。 将其粘贴到 MCP 客户端指定的相应配置目录中。

使用示例

尝试询问 Claude:

  • “转录此音频文件并识别不同的说话人”
  • “将此录音转换为文本并将其翻译成西班牙语”
  • “分析此语音中的情感和情绪”
  • “从这个长音频文件中提取关键主题并创建章节”
  • “转录此对话并总结要点”

可选功能

您可以添加 GLADIA_MCP_BASE_PATH 环境变量到 claude_desktop_config.json 中,以指定 MCP 服务器应查找和输出使用相对路径指定文件的基本路径。

贡献

如果您想贡献或从源代码运行:

  1. 克隆存储库:
git clone https://github.com/gladia/gladia-mcp
cd gladia-mcp
  1. 创建一个虚拟环境并安装依赖项 使用 uv:
uv venv
source .venv/bin/activate
uv pip install -e ".[dev]"
  1. 复制 .env.example.env 并添加您的 Gladia API 密钥:
cp .env.example .env
# 编辑 .env 并添加您的 API 密钥
  1. 运行测试以确保一切正常:
./scripts/test.sh
# 或使用选项
./scripts/test.sh --verbose --fail-fast
  1. 在 Claude Desktop 中安装服务器:mcp install gladia_mcp/server.py

  2. 使用 MCP Inspector 在本地调试和测试:mcp dev gladia_mcp/server.py

API 端点

健康检查

GET /health

转录音频

POST /transcribe

参数:

  • file: 音频文件 (multipart/form-data)
  • diarization: 启用说话人区分 (boolean, optional)
  • language: 语言代码 (string, optional)

使用 curl 的示例:

curl -X POST "http://localhost:8000/transcribe" \
  -H "accept: application/json" \
  -H "Content-Type: multipart/form-data" \
  -F "file=@audio.wav" \
  -F "diarization=true"

故障排除

使用 Claude Desktop 运行时,日志位于:

  • Windows: %APPDATA%\Claude\logs\mcp-server-gladia.log
  • macOS: ~/Library/Logs/Claude/mcp-server-gladia.log

MCP Gladia: spawn uvx ENOENT

如果您遇到错误“MCP Gladia: spawn uvx ENOENT”,请通过在终端中运行以下命令来确认其绝对路径:

which uvx

获得绝对路径(例如,/usr/local/bin/uvx)后,更新您的配置以使用该路径(例如,"command": "/usr/local/bin/uvx")。 这确保引用了正确的执行文件。

开发

运行测试

pytest

代码风格

该项目遵循 PEP 8 风格指南。 使用 flake8 进行 linting:

flake8 gladia_mcp

许可证

MIT 许可证

推荐服务器

Baidu Map

Baidu Map

百度地图核心API现已全面兼容MCP协议,是国内首家兼容MCP协议的地图服务商。

官方
精选
JavaScript
Playwright MCP Server

Playwright MCP Server

一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。

官方
精选
TypeScript
Magic Component Platform (MCP)

Magic Component Platform (MCP)

一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。

官方
精选
本地
TypeScript
Audiense Insights MCP Server

Audiense Insights MCP Server

通过模型上下文协议启用与 Audiense Insights 账户的交互,从而促进营销洞察和受众数据的提取和分析,包括人口统计信息、行为和影响者互动。

官方
精选
本地
TypeScript
VeyraX

VeyraX

一个单一的 MCP 工具,连接你所有喜爱的工具:Gmail、日历以及其他 40 多个工具。

官方
精选
本地
graphlit-mcp-server

graphlit-mcp-server

模型上下文协议 (MCP) 服务器实现了 MCP 客户端与 Graphlit 服务之间的集成。 除了网络爬取之外,还可以将任何内容(从 Slack 到 Gmail 再到播客订阅源)导入到 Graphlit 项目中,然后从 MCP 客户端检索相关内容。

官方
精选
TypeScript
Kagi MCP Server

Kagi MCP Server

一个 MCP 服务器,集成了 Kagi 搜索功能和 Claude AI,使 Claude 能够在回答需要最新信息的问题时执行实时网络搜索。

官方
精选
Python
e2b-mcp-server

e2b-mcp-server

使用 MCP 通过 e2b 运行代码。

官方
精选
Neon MCP Server

Neon MCP Server

用于与 Neon 管理 API 和数据库交互的 MCP 服务器

官方
精选
Exa MCP Server

Exa MCP Server

模型上下文协议(MCP)服务器允许像 Claude 这样的 AI 助手使用 Exa AI 搜索 API 进行网络搜索。这种设置允许 AI 模型以安全和受控的方式获取实时的网络信息。

官方
精选