MCP 服务器

RAT MCP Server (Retrieval Augmented Thinking)

🧠 MCP 服务器，实现了 RAT（检索增强思维）—— 结合了 DeepSeek 的推理能力和 GPT-4/Claude/Mistral 的回复，并在交互之间保持对话上下文。

newideas99

高级AI推理

编程文档访问

AI记忆系统

数据库交互

访问服务器

README

Deepseek-Thinking-Claude-3.5-Sonnet-CLINE-MCP

一个模型上下文协议 (MCP) 服务器，它通过 OpenRouter 将 DeepSeek R1 的推理能力与 Claude 3.5 Sonnet 的响应生成相结合。此实现使用两阶段过程，其中 DeepSeek 提供结构化推理，然后将其合并到 Claude 的响应生成中。

特性

两阶段处理:
- 使用 DeepSeek R1 进行初始推理（5 万字符上下文）
- 使用 Claude 3.5 Sonnet 进行最终响应（60 万字符上下文）
- 通过 OpenRouter 的统一 API 访问两个模型
- 将 DeepSeek 的推理令牌注入到 Claude 的上下文中
智能对话管理:
- 使用文件修改时间检测活动对话
- 处理多个并发对话
- 自动过滤掉已结束的对话
- 支持在需要时清除上下文
优化参数:
- 模型特定的上下文限制：
  - DeepSeek：50,000 个字符用于集中推理
  - Claude：600,000 个字符用于全面响应
- 推荐设置：
  - temperature: 0.7 用于平衡创造力
  - top_p: 1.0 用于完整概率分布
  - repetition_penalty: 1.0 用于防止重复

安装

通过 Smithery 安装

要通过 Smithery 自动为 Claude Desktop 安装 DeepSeek Thinking with Claude 3.5 Sonnet，请执行以下操作：

npx -y @smithery/cli install @newideas99/Deepseek-Thinking-Claude-3.5-Sonnet-CLINE-MCP --client claude

手动安装

克隆存储库：

git clone https://github.com/yourusername/Deepseek-Thinking-Claude-3.5-Sonnet-CLINE-MCP.git
cd Deepseek-Thinking-Claude-3.5-Sonnet-CLINE-MCP

安装依赖项：

npm install

创建一个包含您的 OpenRouter API 密钥的 .env 文件：

# 必需：DeepSeek 和 Claude 模型的 OpenRouter API 密钥
OPENROUTER_API_KEY=your_openrouter_api_key_here

# 可选：模型配置（显示以下默认值）
DEEPSEEK_MODEL=deepseek/deepseek-r1  # 用于推理的 DeepSeek 模型
CLAUDE_MODEL=anthropic/claude-3.5-sonnet:beta  # 用于响应的 Claude 模型

构建服务器：

npm run build

与 Cline 一起使用

添加到您的 Cline MCP 设置（通常在 ~/.vscode/globalStorage/saoudrizwan.claude-dev/settings/cline_mcp_settings.json 中）：

{
  "mcpServers": {
    "deepseek-claude": {
      "command": "/path/to/node",
      "args": ["/path/to/Deepseek-Thinking-Claude-3.5-Sonnet-CLINE-MCP/build/index.js"],
      "env": {
        "OPENROUTER_API_KEY": "your_key_here"
      },
      "disabled": false,
      "autoApprove": []
    }
  }
}

工具使用

服务器提供两个工具来生成和监控响应：

generate_response

用于生成响应的主要工具，具有以下参数：

{
  "prompt": string,           // 必需：问题或提示
  "showReasoning"?: boolean, // 可选：显示 DeepSeek 的推理过程
  "clearContext"?: boolean,  // 可选：清除对话历史记录
  "includeHistory"?: boolean // 可选：包含 Cline 对话历史记录
}

check_response_status

用于检查响应生成任务状态的工具：

{
  "taskId": string  // 必需：来自 generate_response 的任务 ID
}

响应轮询

服务器使用轮询机制来处理长时间运行的请求：

初始请求：
- generate_response 立即返回一个任务 ID
- 响应格式：{"taskId": "uuid-here"}
状态检查：
- 使用 check_response_status 轮询任务状态
- 注意： 响应可能需要长达 60 秒才能完成
- 状态进展：pending → reasoning → responding → complete

在 Cline 中的示例用法：

// 初始请求
const result = await use_mcp_tool({
  server_name: "deepseek-claude",
  tool_name: "generate_response",
  arguments: {
    prompt: "What is quantum computing?",
    showReasoning: true
  }
});

// 从结果中获取 taskId
const taskId = JSON.parse(result.content[0].text).taskId;

// 轮询状态（可能需要在 ~60 秒内进行多次检查）
const status = await use_mcp_tool({
  server_name: "deepseek-claude",
  tool_name: "check_response_status",
  arguments: { taskId }
});

// 完成时的示例状态响应：
{
  "status": "complete",
  "reasoning": "...",  // 如果 showReasoning 为 true
  "response": "..."    // 最终响应
}

开发

对于具有自动重建功能的开发：

npm run watch

工作原理

推理阶段 (DeepSeek R1):
- 使用 OpenRouter 的推理令牌功能
- 修改提示以在捕获推理时输出“done”
- 从响应元数据中提取推理
响应阶段 (Claude 3.5 Sonnet):
- 接收原始提示和 DeepSeek 的推理
- 生成包含推理的最终响应
- 维护对话上下文和历史记录