Web Search MCP Server
Enables web searching and content scraping through Google Custom Search API. Provides tools to search the internet, extract webpage content, and automatically scrape search results for comprehensive information gathering.
README
Web Search MCP Server
一个为 AgentX 平台设计的网页搜索 MCP(Model Context Protocol)服务器,提供强大的网页搜索和内容抓取功能。
🚀 功能特性
- 网页搜索: 使用 Google Custom Search API 进行互联网搜索
- 内容抓取: 抓取指定网页的文本内容和元数据
- 智能组合: 搜索并自动抓取前几个结果的内容
- 多语言支持: 支持中文、英文等多种语言搜索
- 模拟模式: 无需API密钥即可测试基本功能
🛠️ 工具列表
1. web_search
在互联网上搜索信息,返回相关的网页链接和摘要。
参数:
query(必需): 搜索查询关键词maxResults(可选): 最大返回结果数量,默认10language(可选): 搜索语言,默认zh-CN
2. web_scrape
抓取指定网页的内容,提取文本和元数据。
参数:
url(必需): 要抓取的网页URLextractText(可选): 是否提取纯文本内容,默认trueextractMetadata(可选): 是否提取元数据,默认true
3. web_search_and_scrape
搜索网页并抓取前几个结果的内容。
参数:
query(必需): 搜索查询关键词maxResults(可选): 最大抓取结果数量,默认3language(可选): 搜索语言,默认zh-CN
📦 安装和配置
1. 安装依赖
npm install
2. 配置环境变量
复制 env.example 为 .env 并配置:
cp env.example .env
编辑 .env 文件:
# Google Custom Search API 配置
SEARCH_API_KEY=your_google_api_key
SEARCH_ENGINE_ID=your_search_engine_id
# 可选配置
SEARCH_PROVIDER=google
REQUEST_TIMEOUT=10000
MAX_RESULTS=10
LOG_LEVEL=info
3. 获取 Google Custom Search API 密钥
- 访问 Google Cloud Console
- 创建新项目或选择现有项目
- 启用 Custom Search API
- 创建 API 密钥
- 创建自定义搜索引擎:
- 访问 Google Custom Search
- 创建新的搜索引擎
- 获取搜索引擎ID
🚀 运行
开发模式
npm run dev
生产模式
npm run build
npm start
🔧 在 AgentX 中集成
1. 部署到 MCP Gateway
在 AgentX 中,通过以下方式部署此 MCP 服务器:
# 使用 npm 安装命令
npm install -g web-search-mcp
# 或者使用 git 克隆
git clone https://github.com/Mantraa-Zzz/mcp.git
cd mcp
npm install
npm run build
2. 配置 AgentX
在 AgentX 的 .env 文件中确保 MCP Gateway 配置正确:
# MCP Gateway 配置
MCP_GATEWAY_BASE_URL=http://localhost:8081
MCP_GATEWAY_API_KEY=123456
3. 重启 AgentX 容器
docker restart agentx
📝 使用示例
在 AgentX 中创建 Agent 时使用
- 登录 AgentX 管理界面
- 创建新的 Agent
- 在工具配置中选择 "web_search" 相关工具
- Agent 将能够使用网页搜索功能
示例对话
用户: "帮我搜索最新的 AI 技术趋势"
Agent: 我将为您搜索最新的 AI 技术趋势信息。
调用 web_search 工具
- 查询: "最新 AI 技术趋势 2024"
- 返回相关网页链接和摘要
用户: "抓取第一个搜索结果的内容"
Agent: 我将抓取第一个搜索结果的详细内容。
调用 web_scrape 工具
- URL: [第一个搜索结果的URL]
- 返回完整的网页内容
🔍 测试
模拟模式测试
即使没有配置 Google API 密钥,服务器也会返回模拟数据,方便测试基本功能。
真实 API 测试
配置正确的 API 密钥后,可以获取真实的搜索结果。
📋 技术栈
- TypeScript: 主要开发语言
- @modelcontextprotocol/sdk: MCP 协议实现
- Axios: HTTP 客户端
- Cheerio: HTML 解析和内容提取
- dotenv: 环境变量管理
🤝 贡献
欢迎提交 Issue 和 Pull Request 来改进这个项目!
📄 许可证
MIT License
🔗 相关链接
推荐服务器
Baidu Map
百度地图核心API现已全面兼容MCP协议,是国内首家兼容MCP协议的地图服务商。
Playwright MCP Server
一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。
Magic Component Platform (MCP)
一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。
Audiense Insights MCP Server
通过模型上下文协议启用与 Audiense Insights 账户的交互,从而促进营销洞察和受众数据的提取和分析,包括人口统计信息、行为和影响者互动。
VeyraX
一个单一的 MCP 工具,连接你所有喜爱的工具:Gmail、日历以及其他 40 多个工具。
graphlit-mcp-server
模型上下文协议 (MCP) 服务器实现了 MCP 客户端与 Graphlit 服务之间的集成。 除了网络爬取之外,还可以将任何内容(从 Slack 到 Gmail 再到播客订阅源)导入到 Graphlit 项目中,然后从 MCP 客户端检索相关内容。
Kagi MCP Server
一个 MCP 服务器,集成了 Kagi 搜索功能和 Claude AI,使 Claude 能够在回答需要最新信息的问题时执行实时网络搜索。
e2b-mcp-server
使用 MCP 通过 e2b 运行代码。
Neon MCP Server
用于与 Neon 管理 API 和数据库交互的 MCP 服务器
Exa MCP Server
模型上下文协议(MCP)服务器允许像 Claude 这样的 AI 助手使用 Exa AI 搜索 API 进行网络搜索。这种设置允许 AI 模型以安全和受控的方式获取实时的网络信息。