企业级多Agent AI平台 — 从架构到实现的完整学习指南
建议先看项目全景,再补 AI 基础概念,随后沿单次对话、LLM、RAG、Graph 编排、安全与多端接入逐步深入。页面中带虚线下划线的新名词支持悬停查看解释。
推荐顺序:00 → 01 → 02 → 03 → 05 → 07 → 10 → 04/13/14 → 08/09/17 → 12/27 → 15/16 → 20 以后工程化专题。
目录顺序严格跟随文档编号;初学者推荐阅读路径见上方。
Enterprise Agent Hub 是一个企业级多Agent AI平台,类似于一个内部的"AI助手应用商店"。它提供了100+内置的AI Agent(智能体),覆盖6大领域(creative/enterprise/education/lifestyle/productivity/specialized),例如:知识库问答、简历优化、数据分析(NL2SQL)、文案写作、智能相册管理、深度研究、合同审查等。
通俗理解:你可以把它想象成一个企业版的ChatGPT + 插件系统,但每个"插件"(Agent)都有独立的专业能力、工具和交互方式。
hub-common — 共享DTO、工具类
hub-doc-parser — 文档解析(PDF/DOCX/MD策略模式)
hub-conversation — 对话持久化(27个JPA实体)
hub-llm-core — LLM核心引擎、RAG管线、Agent基类
hub-vector-store — Milvus向量存储、双写、去重
hub-key-pool — API密钥池管理、降级策略
hub-prompt-guard — 多层提示词注入防护
hub-agent-core — Graph执行引擎、Agent编排
hub-agents — 100+内置Agent实现(6大领域)
hub-mcp-client — MCP协议客户端
hub-tools — 工具市场/生活工具体系(生日、记账、收纳等)
hub-api — REST API、SSE流式推送
hub-agent-channels — 飞书/钉钉/QQ 入站机器人、企微出站推送 + Voice 通道
hub-frontend — Vue 3 前端应用
面试时不建议逐条背 42 个功能点,而是按主线讲:Agent 扩展机制、RAG 可信问答、复杂任务编排、模型与任务可靠性、提示词安全与合规、多端接入复用、可观测与成本分析、分布式运行态演进。下面的亮点都可以归到这些主线里展开。
17. 拦截器诊断与代码层管理 | 18. 三层模型降级 | 19. TodoList任务追踪 | 20. 长期记忆系统 | 21. Graph Observation | 22. Redis/MySQL双Checkpoint | 23. Prompt评测平台 | 24. BackgroundTask异步任务 | 25. AgentSpec声明式配置 | 26. PII检测与脱敏 | 27. Agent健康监控 | 28. Agent任务生命周期 | 29. Agent流水线(Pipeline) | 30. 15个分布式契约 + 19个运行态开关 | 31. 异步工具执行 | 32. 多模态工具结果 | 33. 状态感知工具 | 34. LLM调用追踪 | 35. AI智能相册 | 36. 内容创作库 | 37. 100+ Agent矩阵 | 38. 飞书/钉钉/QQ 入站 + 企业微信出站 + Voice 适配 | 39. 通知模板引擎 | 40. 分布式任务保护 | 41. 用户级限流 | 42. Skill技能热加载
| 分类 | Agent | 能力概述 |
|---|---|---|
| 聊天 | chat(通用对话) | 自由对话、Plan模式、快速提问 |
| rag(知识库助手) | RAG问答、来源引用、文档管理 | |
| 办公 | resume(简历优化) | STAR重写、JD匹配、面试准备 |
| resume-screen(简历筛选) | 6维评分(100分制)、A/B/C/D评级 | |
| ppt(PPT大纲) | 结构化演示大纲生成、迭代优化 | |
| copywriting(文案写作) | AIDA/FAB结构、多版本对比 | |
| 工具 | translate(翻译助手) | 自动语言检测、术语表支持 |
| crawler(网页助手) | 网页内容提取、安全管线 | |
| photo(智能相册) | AI分析、标签、相册、时间线、地图 | |
| wechat(微信备份) | 聊天记录导入、统计分析 | |
| netdisk(超级网盘) | AI摘要、思维导图、向量关系图 | |
| book-scraper(小说抓取) | 小说网站爬取、结构分析 | |
| mosaic(马赛克拼图) | 感知加权RGB距离算法拼图生成 | |
| 创意 | novel(小说书库) | 大纲提取、角色分析、续写建议 |
| audiobook(有声读物) | 章节音频播放、内容管理 | |
| culture(文博珍藏) | 历史背景分析、时代关联 | |
| drama(剧本工坊) | 情节结构分析、角色设计 | |
| 专业 | data(数据分析) | NL2SQL自然语言查数据、Schema感知 |
| deep-research(深度研究) | 多步骤研究、MCP工具、ReAct推理 |
💡 以上仅展示核心 Agent,完整列表含 100+ 个覆盖 creative/enterprise/education/lifestyle/productivity/specialized 六大领域的专业 Agent。
文档解析:PDFBox/POI/CommonMark 三个策略实现 ParserStrategy 接口,运行时根据文件类型选择。
LLM Provider:按协议适配 ChatModel 工厂,包括智谱原生、OpenAI 兼容、Anthropic/MiniMax 兼容;管理端供应商目录覆盖 DeepSeek、DashScope、Ollama、自定义等。
TrackedChatModel — 包装原始ChatModel,自动记录Token消耗和延迟。
PooledChatModel — 包装原始ChatModel,集成Key池轮转。
SSE流式推送:LLM生成Token时,通过Flux事件流实时推送给前端。
AbstractLlmAgent — 定义了系统提示词、历史管理、模型选择、流式响应的骨架流程,子类只需实现特定逻辑。
Agent任务编排器内置熔断器,当某个Agent连续失败时自动熔断,保护系统稳定。
前端根据Agent声明的27种能力枚举值,动态渲染对应的面板组件和工具栏。
┌──────────────┐ ┌──────────────┐ ┌──────────────┐ ┌──────────────┐
│ Web 前端 │ │ 飞书机器人 │ │ 钉钉机器人 │ │ 小程序/企微出站│
│ Vue 3 + SSE │ │ WebSocket卡片 │ │ Stream │ │ │
└──────┬───────┘ └──────┬───────┘ └──────┬───────┘ └──────┬───────┘
│ │ │ │
└──────────────────┴──────────────────┴──────────────────┘
│
┌───────▼───────┐
│ hub-api │
│ 90+ Controller │
│ JWT认证 + SSE │
└───────┬───────┘
│
┌──────────────▼──────────────┐
│ AgentTaskOrchestrator │
│ 超时控制 + 熔断 + 并发控制 │
└──────────────┬──────────────┘
│
┌─────────────────────┼─────────────────────┐
│ │ │
┌────────▼────────┐ ┌───────▼───────┐ ┌────────▼────────┐
│ Graph执行引擎 │ │ LLM核心引擎 │ │ 提示词防护层 │
│ ReAct/并行/HITL │ │ 多模型适配 │ │ 5层纵深防御 │
└────────┬────────┘ └───────┬───────┘ └─────────────────┘
│ │
┌────────▼────────┐ ┌──────▼──────┐ ┌──────────────┐
│ 100+ 内置Agent │ │ RAG管线 │ │ 密钥池管理 │
│ 各自独立能力 │ │ 6阶段处理 │ │ 轮转+降级 │
└────────┬────────┘ └──────┬──────┘ └──────────────┘
│ │
┌──────▼───────────────────▼──────┐
│ 基础设施层 │
│ MySQL │ Milvus │ Redis │ RocketMQ │
└─────────────────────────────────┘
"Enterprise Agent Hub 是我独立开发的企业级多Agent AI平台,基于 Spring Boot 3.5 + Spring AI Alibaba + Vue 3.5 构建。平台内置了100+专业AI Agent,统一接入 Web、小程序、飞书/钉钉/QQ 入站机器人、企业微信出站和语音入口。面试时我会重点讲三条主线:Agent Hub 扩展机制、RAG 可信问答链路、复杂任务编排与可控执行;再补企业级工程能力,包括提示词安全、密钥池降级、任务生命周期、运行监控,以及 15 个分布式契约接口 + 19 个运行态开关支撑 local/Redis 渐进演进。"
以下是项目新增的全部功能模块,涵盖拦截器、Hook、图执行、记忆系统、安全防护等多个维度:
| Module | Description | Status |
|---|---|---|
拦截器诊断管理 | InterceptorChainManager 注册、排序、诊断,代码层预留启停能力 | ✅ 已上线 |
模型降级 | ModelFallbackInterceptor 多模型容灾 | ✅ 已上线 |
TodoList 任务追踪 | Agent 自动规划复杂任务进度 | ✅ 已上线 |
大结果驱逐 | LargeResultEviction 防上下文爆炸 | ✅ 已上线 |
工具动态筛选 | ToolSelection 关键词评分 + system prompt 建议性筛选;当前不是物理移除 tool callbacks 的硬筛选 | ✅ 已上线(软筛选) |
子Agent委派 | SubAgent 自动任务路由 | ✅ 已上线 |
上下文编辑 | ContextEditing 自动压缩 | ✅ 已上线 |
长期记忆 | 跨会话持久化与工具读写 | ✅ 已上线 |
PII检测 | 隐私数据脱敏保护 | ✅ 已上线 |
自动摘要Hook | 上下文溢出压缩 | ✅ 已上线 |
人机协同增强 | 工具粒度审批控制 | ✅ 已上线 |
Graph Observation | Micrometer 监控指标 | ✅ 已上线 |
Redis Checkpoint | 高性能图状态持久化 | ✅ 已上线 |
Prompt评测平台 | A/B测试自动评分 | ✅ 已上线 |
后台任务系统 | Agent异步长任务执行 | ✅ 已上线 |
AgentSpec | YAML声明式规格解析、校验、管理端 CRUD 与手动 reload;不等同于文件监听式自动热替换 | ✅ 已上线(配置治理) |
DataAgent | NL2SQL自然语言查询 | ✅ 已上线 |
VoiceChannel | HTTP 单轮语音入口:ASR → Agent → 可选 TTS;当前不是流式双工语音会话 | ✅ 已上线(语音入口) |
沙箱执行 | ProcessBuilder 进程级执行器,支持超时、工作目录和环境变量清洗;强隔离 Docker/VM 属于后续增强 | ✅ 已上线(基础隔离) |
结构化输出增强 | Schema注入+JSON验证 | ✅ 已上线 |
"我做的是一个企业级多 Agent AI 平台。它把知识库问答、数据分析、深度研究、简历、相册、网盘、内容创作等能力统一成 Agent Hub,通过 Spring Boot 多模块后端、Vue 前端、微信小程序、飞书/钉钉/QQ 入站机器人、企业微信出站和语音通道提供服务。技术重点不只是接大模型,而是围绕 Agent 扩展、RAG 可信回答、复杂任务编排、提示词安全、密钥池降级、任务生命周期、可观测和分布式运行态做工程化平台。"
score(d) = Σ 1/(k + rank_i(d)) 融合,只依赖排名不需分数归一化
DocumentParser 接口 + ParserFactory 路由,新增格式只需实现接口加 @Component
hub-doc-parser 提升为独立服务,迁移成本很低。
StringBuilder 在流处理中累积文本片段,在 Flux.concatWith(Flux.defer(...)) 中做最终持久化和来源发送,保证持久化在流结束后按序执行。