jcrawl4ai-mcp-server

jcrawl4ai-mcp-server

jcrawl4ai-mcp-server

Category
访问服务器

README

jcrawl4ai-mcp-server

Java implementation of MCP Server for interacting with Crawl4ai API.

Project Overview

jcrawl4ai-mcp-server is a Spring Boot-based MCP server that interacts with the Crawl4ai API to perform web crawling. The main functionalities include:

  • Crawling specified URLs using a given strategy, maximum depth, and output format.
  • Getting the crawl result by a given task ID.

Configuration

application.properties

Configure the following properties in the src/main/resources/application.properties file:

  • cawl4ai.base-url: Base URL of the Crawl4ai server.
  • cawl4ai.api-token: API token for the Crawl4ai server.

Example configuration:

cawl4ai.base-url=http://your-cral4ai-server-url:11235
cawl4ai.api-token=your-api-token

Dependencies

The project depends on the following libraries:

  • Spring AI MCP Server
  • Spring Boot
  • Hutool

Running the Project

Build and run the project using Maven:

mvn clean install
java -jar target/jcawl4ai-mcp-server-1.0.0.jar

APIs

Crawl4aiApi

crawl Method

  • Description: Call the Crawl4ai API to crawl the specified URLs.
  • Parameters:
    • urls: Array of target website URLs.
    • strategy: Crawl strategy.
    • max_depth: Maximum depth.
    • output_format: Output format.
  • Return Value: JSON string of the crawl result.

task Method

  • Description: Get the crawl result by a given task ID.
  • Parameters:
    • taskId: Task ID.
  • Return Value: JSON string of the crawl result.

Logging

Log file path: ./target/mcp-stdio-server.log.

MCP Server Configuration

{
  "mcpServers": {
    "jcawl4ai-mcp-server": {
      "autoApprove": [
        "crawl",
        "task"
      ],
      "disabled": false,
      "timeout": 60,
      "command": "java",
      "args": [
        "-jar",
        "/path/to/your/jar/file/jcawl4ai-mcp-server-1.0.0.jar"
      ],
      "transportType": "stdio"
    }
  }
}

Contact

If you have any questions or suggestions, please contact Ken Ye.


jcrawl4ai-mcp-server

Java 实现的 MCP 服务器,用于与 Crawl4ai API 进行交互。

项目概述

jcrawl4ai-mcp-server 是一个基于 Spring Boot 的 MCP 服务器,用于调用 Crawl4ai API 进行网页爬取。该项目的主要功能包括:

  • 使用指定的策略、最大深度和输出格式对给定的 URL 进行爬取。
  • 根据给定的任务 ID 获取爬取结果。

配置

application.properties

src/main/resources/application.properties 文件中配置以下属性:

  • cawl4ai.base-url:Crawl4ai 服务器的基础 URL。
  • cawl4ai.api-token:Crawl4ai 服务器的 API 令牌。

示例配置:

cawl4ai.base-url=http://your-cral4ai-server-url:11235
cawl4ai.api-token=your-api-token

依赖

项目依赖于以下库:

  • Spring AI MCP Server
  • Spring Boot
  • Hutool

启动

使用 Maven 构建并运行项目:

mvn clean install
java -jar target/jcawl4ai-mcp-server-1.0.0.jar

接口

Crawl4aiApi

crawl 方法

  • 描述:调用 Crawl4ai API 爬取指定的 URL。
  • 参数
    • urls:目标网站的 URL 数组。
    • strategy:爬取策略。
    • max_depth:最大深度。
    • output_format:输出格式。
  • 返回值:爬取结果的 JSON 字符串。

task 方法

  • 描述:根据给定的任务 ID 获取爬取结果。
  • 参数
    • taskId:任务 ID。
  • 返回值:爬取结果的 JSON 字符串。

日志

日志文件路径为 ./target/mcp-stdio-server.log

MCP Server 配置

{
  "mcpServers": {
    "jcawl4ai-mcp-server": {
      "autoApprove": [
        "crawl",
        "task"
      ],
      "disabled": false,
      "timeout": 60,
      "command": "java",
      "args": [
        "-jar",
        "/path/to/your/jar/file/jcawl4ai-mcp-server-1.0.0.jar"
      ],
      "transportType": "stdio"
    }
  }
}

联系

如果您有任何问题或建议,请联系 Ken Ye

推荐服务器

Baidu Map

Baidu Map

百度地图核心API现已全面兼容MCP协议,是国内首家兼容MCP协议的地图服务商。

官方
精选
JavaScript
Playwright MCP Server

Playwright MCP Server

一个模型上下文协议服务器,它使大型语言模型能够通过结构化的可访问性快照与网页进行交互,而无需视觉模型或屏幕截图。

官方
精选
TypeScript
Magic Component Platform (MCP)

Magic Component Platform (MCP)

一个由人工智能驱动的工具,可以从自然语言描述生成现代化的用户界面组件,并与流行的集成开发环境(IDE)集成,从而简化用户界面开发流程。

官方
精选
本地
TypeScript
Audiense Insights MCP Server

Audiense Insights MCP Server

通过模型上下文协议启用与 Audiense Insights 账户的交互,从而促进营销洞察和受众数据的提取和分析,包括人口统计信息、行为和影响者互动。

官方
精选
本地
TypeScript
VeyraX

VeyraX

一个单一的 MCP 工具,连接你所有喜爱的工具:Gmail、日历以及其他 40 多个工具。

官方
精选
本地
graphlit-mcp-server

graphlit-mcp-server

模型上下文协议 (MCP) 服务器实现了 MCP 客户端与 Graphlit 服务之间的集成。 除了网络爬取之外,还可以将任何内容(从 Slack 到 Gmail 再到播客订阅源)导入到 Graphlit 项目中,然后从 MCP 客户端检索相关内容。

官方
精选
TypeScript
Kagi MCP Server

Kagi MCP Server

一个 MCP 服务器,集成了 Kagi 搜索功能和 Claude AI,使 Claude 能够在回答需要最新信息的问题时执行实时网络搜索。

官方
精选
Python
e2b-mcp-server

e2b-mcp-server

使用 MCP 通过 e2b 运行代码。

官方
精选
Neon MCP Server

Neon MCP Server

用于与 Neon 管理 API 和数据库交互的 MCP 服务器

官方
精选
Exa MCP Server

Exa MCP Server

模型上下文协议(MCP)服务器允许像 Claude 这样的 AI 助手使用 Exa AI 搜索 API 进行网络搜索。这种设置允许 AI 模型以安全和受控的方式获取实时的网络信息。

官方
精选