Context Optimizer MCP

Context Optimizer MCP

一个 MCP 服务器,它使用 Redis 和内存缓存来优化和扩展大型聊天记录的上下文窗口。

degenhero

开发者工具
访问服务器

README

Context Optimizer MCP

这是一个 MCP (模型上下文协议) 服务器,它使用 Redis 和内存缓存来优化和扩展大型聊天记录的上下文窗口。

特性

  • 双层缓存: 结合了快速的内存 LRU 缓存和持久化的 Redis 存储
  • 智能上下文管理: 自动总结较旧的消息,以在 token 限制内保持上下文
  • 速率限制: 基于 Redis 的速率限制,具有突发保护
  • API 兼容性: 可直接替换 Anthropic API,并增强了上下文处理
  • 指标收集: 内置的性能监控和日志记录

工作原理

此 MCP 服务器充当您的应用程序和 LLM 提供商(目前支持 Anthropic 的 Claude 模型)之间的中间件。它通过以下策略智能地管理对话上下文:

  1. 上下文窗口优化: 当对话接近模型的 token 限制时,会自动总结较旧的消息,同时保留关键信息。

  2. 高效缓存:

    • 内存 LRU 缓存,用于频繁访问的对话摘要
    • Redis,用于持久化、分布式存储对话历史记录和摘要
  3. 透明处理: 服务器自动处理所有上下文管理,同时保持与标准 API 的兼容性。

快速开始

前提条件

  • Node.js 18+
  • Redis 服务器(本地或远程)
  • Anthropic API 密钥

安装选项

1. 使用 MCP 客户端

安装和运行此服务器的最简单方法是使用 MCP 客户端:

# 通过 npx 安装
npx mcp install degenhero/context-optimizer-mcp

# 或者使用 uvx
uvx mcp install degenhero/context-optimizer-mcp

请确保在安装过程中提示时设置您的 Anthropic API 密钥。

2. 手动安装

# 克隆仓库
git clone https://github.com/degenhero/context-optimizer-mcp.git
cd context-optimizer-mcp

# 安装依赖
npm install

# 设置环境变量
cp .env.example .env
# 编辑 .env 文件进行配置

# 启动服务器
npm start

3. 使用 Docker

# 克隆仓库
git clone https://github.com/degenhero/context-optimizer-mcp.git
cd context-optimizer-mcp

# 使用 Docker Compose 构建并启动
docker-compose up -d

这将启动 MCP 服务器和 Redis 实例。

配置

通过编辑 .env 文件来配置服务器:

# 服务器配置
PORT=3000

# Anthropic API 密钥
ANTHROPIC_API_KEY=your_anthropic_api_key

# Redis 配置
REDIS_HOST=localhost
REDIS_PORT=6379
REDIS_PASSWORD=

# 缓存设置
IN_MEMORY_CACHE_MAX_SIZE=1000
REDIS_CACHE_TTL=86400  # 24 小时,单位为秒

# 模型设置
DEFAULT_MODEL=claude-3-opus-20240229
DEFAULT_MAX_TOKENS=4096

API 使用

该服务器公开了一个兼容的 API 端点,其工作方式类似于标准的 Claude API,并具有额外的上下文优化功能:

// 客户端使用示例
const response = await fetch('http://localhost:3000/v1/messages', {
  method: 'POST',
  headers: {
    'Content-Type': 'application/json',
  },
  body: JSON.stringify({
    model: 'claude-3-opus-20240229',
    messages: [
      { role: 'user', content: 'Hello!' },
      { role: 'assistant', content: 'How can I help you today?' },
      { role: 'user', content: 'Tell me about context management.' }
    ],
    max_tokens: 1000,
    // 可选的 MCP 特定参数:
    conversation_id: 'unique-conversation-id', // 用于上下文跟踪
    context_optimization: true, // 启用/禁用优化
  }),
});

const result = await response.json();

附加端点

  • GET /v1/token-count?text=your_text&model=model_name: 计算文本字符串中的 token 数量
  • GET /health: 服务器健康检查
  • GET /metrics: 查看服务器性能指标

测试

包含一个测试脚本,用于演示上下文优化如何工作:

# 运行测试脚本
npm run test:context

这将启动一个交互式会话,您可以在其中进行对话,并查看上下文如何随着增长而得到优化。

高级特性

上下文摘要

当对话超过模型 token 限制的 80% 时,服务器会自动总结较旧的消息。此摘要将被缓存以供将来使用。

对话连续性

通过在请求中提供一致的 conversation_id,即使单个请求超过 token 限制,服务器也可以跨多个 API 调用保持上下文。

性能考虑

  • 内存缓存为活动对话提供最快的访问速度
  • Redis 支持持久化和跨服务器实例共享
  • 摘要操作会为超过 token 阈值的请求增加一些延迟

文档

其他文档可以在 docs/ 目录中找到:

许可证

MIT

推荐服务器

Playwright MCP Server

Playwright MCP Server

一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。

官方
精选
TypeScript
Magic Component Platform (MCP)

Magic Component Platform (MCP)

一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。

官方
精选
本地
TypeScript
MCP Package Docs Server

MCP Package Docs Server

促进大型语言模型高效访问和获取 Go、Python 和 NPM 包的结构化文档,通过多语言支持和性能优化来增强软件开发。

精选
本地
TypeScript
Claude Code MCP

Claude Code MCP

一个实现了 Claude Code 作为模型上下文协议(Model Context Protocol, MCP)服务器的方案,它可以通过标准化的 MCP 接口来使用 Claude 的软件工程能力(代码生成、编辑、审查和文件操作)。

精选
本地
JavaScript
@kazuph/mcp-taskmanager

@kazuph/mcp-taskmanager

用于任务管理的模型上下文协议服务器。它允许 Claude Desktop(或任何 MCP 客户端)在基于队列的系统中管理和执行任务。

精选
本地
JavaScript
mermaid-mcp-server

mermaid-mcp-server

一个模型上下文协议 (MCP) 服务器,用于将 Mermaid 图表转换为 PNG 图像。

精选
JavaScript
Jira-Context-MCP

Jira-Context-MCP

MCP 服务器向 AI 编码助手(如 Cursor)提供 Jira 工单信息。

精选
TypeScript
Linear MCP Server

Linear MCP Server

一个模型上下文协议(Model Context Protocol)服务器,它与 Linear 的问题跟踪系统集成,允许大型语言模型(LLM)通过自然语言交互来创建、更新、搜索和评论 Linear 问题。

精选
JavaScript
Sequential Thinking MCP Server

Sequential Thinking MCP Server

这个服务器通过将复杂问题分解为顺序步骤来促进结构化的问题解决,支持修订,并通过完整的 MCP 集成来实现多条解决方案路径。

精选
Python
Curri MCP Server

Curri MCP Server

通过管理文本笔记、提供笔记创建工具以及使用结构化提示生成摘要,从而实现与 Curri API 的交互。

官方
本地
JavaScript