Gaia-X Next-Generation Enterprise AI Application Platform Based on AI New Paradigm

Gaia-X Next-Generation Enterprise AI Application Platform Based on AI New Paradigm

Gaia-X: 面向 AI 新范式的下一代企业级 AI 应用平台。Gaia-X 旨在实现类人脑的、针对企业办公业务场景的 AI 化赋能,包括一系列新颖而稳定的企业级 AI 功能,包括但不限于:企业级管理功能、MCP Server 支持(且支持将企业内部系统 API 转换为 MCP Server 提供服务)、支持自然语言驱动的 RPA(大模型操作电脑)、划词分析和悬浮球等。

YFGaia

研究与数据
访问服务器

README

基于AI新范式的下一代企业AI应用平台 Gaia-X

🌟 项目概览

Gaia-X 是首个基于全新AI范式,专为企业场景设计的聊天机器人应用平台,通过创新的技术架构,解决现有AI产品的核心痛点:

🚀 企业管理 | 🤖 MCP协议支持 | 👥 多Agent协作 💻 自然语言RPA | ✅ 人工确认机制 | 🎨 智能画布渲染

立即试用 | 管理中心 | 文档中心

🎯 核心痛点解决方案

痛点领域 Gaia-X 创新解决方案
缺乏企业管理 完整的用户/权限/计费系统和LLM API托管
不支持MCP协议 首个企业级MCP支持
敏感操作风险 带有人工确认的ReAct工具调用,动态渲染
自然语言RPA困难 大型模型驱动的RPA自动化
多Agent协作薄弱 智能Agent检索和多Agent协作,完成复杂任务

📦 项目架构

1.1 整体项目架构

Architecture

1.2 MCP 调用流程

在 Agent 调用过程中,管理中心不负责调用 MCP 工具。而是客户端的节点程序收到响应结果后,会统一判断是否有函数调用。如果有,则调用相应的 MCP 工具执行。执行链大致如下:

graph LR
    U --> |1|C[Gaia-X Client]
    C-->|2|API[Admin Center]
    API-->|3|LLM[LLM API]
    LLM-->|4|API[Admin Center]
    API-->|5|C[Gaia-X Client]
    C-->|6|B{Function Call?}
    B -- No -->U[User]
    B -- Yes --> MCP[MCP Servers]
    MCP -->|8a. Call| H[Tool 1]
    MCP -->|8b. Call| I[Tool 2]
    H-->|8.1|C[Gaia-X Client]
    I-->|8.1|C[Gaia-X Client]
    C-->|8.2|API[Admin Center]
    API-->|8.3|LLM[LLM API]
    LLM-->|8.4|API[Admin Center]
    API-->|8.5|C[Gaia-X Client]
    C-->|8.6|U[User]
   
    subgraph Possible Nested/Iterative Calls
    H
    I
    end

1.3 客户端启动时的身份验证逻辑

由于这是一个企业级项目,客户端需要完成登录验证才能进入 Chatbot 界面。 以 OAuth2.0 为例(其他逻辑类似),身份验证过程如下:

sequenceDiagram
    participant C as Client Program
    participant A as Admin Center
    participant O as OAuth2.0 Server
    participant U as User

    C->>A: Request authentication page (non-OAuth2.0 login page)
    A->>A: Check current login status
    alt Not logged in
        A->>O: Redirect and open OAuth2.0 login page
        O->>U: Display login interface
        U->>O: Submit credentials for login
        O->>A: Return authentication result (e.g., Token)
        A->>A: Generate JWT after verifying Token and update login status
    else Already logged in
        A->>U: Display authorization button
    end
    U->>A: Click authorize
    A->>C: Redirect back to client and pass authorization information (gaia://oauth-callback?code=xyz)
    C->>C: Client completes login process

流程说明:

  1. 客户端从管理中心请求身份验证页面;
  2. 管理后端确定用户登录状态;
  3. 如果未登录,则重定向到 OAuth2.0 登录页面;
  4. 用户在 OAuth2.0 登录页面上提交凭据,成功登录后返回身份验证结果;
  5. OAuth2.0 登录后,使用身份验证信息重定向到管理后端,生成 JWT 并更新登录状态;
  6. 用户单击授权按钮,管理后端重定向回客户端,完成登录。

2. 核心功能(部分仍在开发中)

2.1 MCP (模型上下文协议) 支持

  • [x] 支持集成任何社区 MCP 服务器。
  • [ ] 通过企业管理中心统一管理所有 MCP 服务器。
  • [x] 所有 MCP 服务器都在客户端上隔离的沙箱环境中运行,确保操作安全和数据隔离。
  • [ ] 独立的 MCP 服务器显示页面(类似于官方 MCP Inspector 效果)

2.2 多Agent智能协同

  • [ ] 支持基于任务编排或 RAG 的智能协作,自动完成复杂任务,无需手动选择 Agent 或工作流程。
  • [ ] 内置用于计算机操作、Python 编程、Web 浏览等的关键 Agent。

2.3 新范式无限画布

  • [ ] Multi-Agent 对话中的每个 Agent 进程都是一个独立的画布,自动生成摘要作为永久记忆。
  • [x] 支持常见的 Artifacts,包括但不限于:
    • SVG, HTML
    • Mermaid, Echarts, PlantUML
  • [x] 支持 MCP 工具动态渲染表单,允许用户交互式修改和控制提交。
  • [ ] 支持 Python、TypeScript、HTML 和其他代码执行

2.4 智能计算机操作

  • [X] 与 Claude Sonnet 3.5+、智谱 CogAgent、字节跳动 UI-TARS、OpenAI computer-use 等模型集成。
  • [X] Agent 可以自主执行任何计算机操作。

2.5 文本选择分析

  • [X] 支持在任何软件界面中选择文本后自动显示 Agent 工具栏,从而实现即时翻译和文案生成等功能。

2.6 企业管理中心

  • [x] 统一身份验证和用户管理:OAuth 2.0、LDAP、钉钉、飞书和其他身份验证方法。
  • [x] 统一模型和工具管理:后端集中配置和授权管理。
  • [ ] 配额管理:细粒度控制用户配额和 API 配额。
  • [ ] 企业内部应用生态系统:MCP 市场、Agent 市场、应用任务市场(针对特定复杂任务)等。
  • [ ] 业务报告:全面的用户、模型和 Agent 使用数据分析报告。

2.7 第三方 Agent 集成

  • [x] 原生支持集成 Dify 和 Coze 等第三方 Agent 平台,并进行统一的授权管理。

3. 技术栈

3.1 客户端

客户端采用基于插件的设计,稍后将采用类似于 VS Code 的微内核插件架构进行构建,从而实现任意扩展。

  • 框架: Electron + React
  • LLM UI: Ant Design X
  • 文本选择监控技术: C++ (Windows), Objective-C (MacOS)

3.2 管理后端

客户端仅用作交互式 UI 和 MCP 管理执行,没有实际的模型调用。 模型调用和工具调用由后端实现。 但是,后端不负责 MCP 工具的特定执行。

  • 大模型交互: Eino Framework + 自研 Multi-Agent
  • 管理 UI: Ant Design Pro (重构 GVA 的前端页面代码,以实现技术堆栈的统一)
  • API 服务: golang + Gin (基于 GVA 框架)

3.3 MCP 服务器

  • 在独立的沙箱环境中运行
  • 支持使用 Python 和 TypeScript 实现

4. 模型选择参考

  • 计算机操作模型: Claude Sonnet 3.5+、CogAgent、UI-TARS、OpenAI computer-use
  • ReAct 推荐模型: Claude Sonnet 3.5+、GPT 4o (DeepSeek v3 模型表现不佳,不建议用于关键任务)

5. 致谢

  • 管理 API 基于 Gin-Vue-Admin 构建,减少了我们的大部分基本管理后端开发工作。

  • 字节跳动的 Eino 是为数不多的基于 golang 的大型模型应用开发框架之一,解决了基本的模型集成和 Agent 问题。

  • 我们使用 Ant Design Pro 重构了 Gin-Vue-Admin 的前端页面,统一了管理后端和客户端的 UI 框架,降低了社区开发难度。

  • 我们基于 Eino 进行了许多二次开发,包括集成常见的模型提供商和 Multi-Agent 架构。 二次开发后,我们将其发布为 Eino-X

  • 为了解决在普通用户客户端上运行 MCP 服务器的问题,我们在项目 mcp-runtime 下打包了一个嵌入式二进制 MCP 运行时环境(支持 MacOS 和 Windows)。


6. 许可证

本项目采用 Apache 2.0 许可证 授权。 欢迎自定义或贡献!


7. 社区支持

我们欢迎通过 Issues 提供反馈和建议。 我们期待您的参与,共同构建未来的企业 AI 应用生态系统。

🎉 感谢您对项目的关注和支持!

推荐服务器

Crypto Price & Market Analysis MCP Server

Crypto Price & Market Analysis MCP Server

一个模型上下文协议 (MCP) 服务器,它使用 CoinCap API 提供全面的加密货币分析。该服务器通过一个易于使用的界面提供实时价格数据、市场分析和历史趋势。 (Alternative, slightly more formal and technical translation): 一个模型上下文协议 (MCP) 服务器,利用 CoinCap API 提供全面的加密货币分析服务。该服务器通过用户友好的界面,提供实时价格数据、市场分析以及历史趋势数据。

精选
TypeScript
MCP PubMed Search

MCP PubMed Search

用于搜索 PubMed 的服务器(PubMed 是一个免费的在线数据库,用户可以在其中搜索生物医学和生命科学文献)。 我是在 MCP 发布当天创建的,但当时正在度假。 我看到有人在您的数据库中发布了类似的服务器,但还是决定发布我的服务器。

精选
Python
mixpanel

mixpanel

连接到您的 Mixpanel 数据。 从 Mixpanel 分析查询事件、留存和漏斗数据。

精选
TypeScript
Sequential Thinking MCP Server

Sequential Thinking MCP Server

这个服务器通过将复杂问题分解为顺序步骤来促进结构化的问题解决,支持修订,并通过完整的 MCP 集成来实现多条解决方案路径。

精选
Python
Nefino MCP Server

Nefino MCP Server

为大型语言模型提供访问德国可再生能源项目新闻和信息的能力,允许按地点、主题(太阳能、风能、氢能)和日期范围进行筛选。

官方
Python
Vectorize

Vectorize

将 MCP 服务器向量化以实现高级检索、私有深度研究、Anything-to-Markdown 文件提取和文本分块。

官方
JavaScript
Mathematica Documentation MCP server

Mathematica Documentation MCP server

一个服务器,通过 FastMCP 提供对 Mathematica 文档的访问,使用户能够从 Wolfram Mathematica 检索函数文档和列出软件包符号。

本地
Python
kb-mcp-server

kb-mcp-server

一个 MCP 服务器,旨在实现便携性、本地化、简易性和便利性,以支持对 txtai “all in one” 嵌入数据库进行基于语义/图的检索。任何 tar.gz 格式的 txtai 嵌入数据库都可以被加载。

本地
Python
Research MCP Server

Research MCP Server

这个服务器用作 MCP 服务器,与 Notion 交互以检索和创建调查数据,并与 Claude Desktop Client 集成以进行和审查调查。

本地
Python
Cryo MCP Server

Cryo MCP Server

一个API服务器,实现了模型补全协议(MCP),用于Cryo区块链数据提取,允许用户通过任何兼容MCP的客户端查询以太坊区块链数据。

本地
Python