Enterprise Project

企业级 AI 知识库问答平台（RAG）

LangGraphLLMRAGHybrid SearchFastAPINext.jsPostgreSQLpgvectorRedisCelery

Project Media

Overview

面向企业知识管理场景，搭建基于 LangGraph 编排的 Hybrid / Workflow RAG 知识库平台，支持文档异步入库、多路检索、流式问答、引用溯源与调试分析。

Key Contributions

01
RAG 工作流（Workflow RAG）：基于 LangGraph 重构问答链路，将问题改写、多路召回、重排、相关性判断、答案生成与引用构建拆分为独立节点，提升系统健壮性与可观测性。
02
混合检索与重排（Hybrid Search）：构建 Dense (pgvector) + Sparse (BM25) 双路召回，引入 Rerank 模型语义重排，解决垂直领域专有名词召回率低、单路检索不稳定的问题。
03
阈值控制与溯源：设计相关性阈值兜底与拒答策略，并实现细粒度 Citations（溯源至文档 Chunk 与摘要），提升答案可信度与可解释性。
04
前后端架构：基于 Python (FastAPI) + SQLAlchemy 开发后端核心业务，基于 React (Next.js) + TypeScript 搭建智能问答工作台、知识库管理页面与调试面板。

Architecture & Design

RAG 整体架构图

RAG 整体架构图

展示系统整体分层与模块协作关系：前端由 Next.js 承载交互，FastAPI 作为统一接入层，对内拆分为 LangGraph 在线问答链路与 Redis + Celery 异步建库链路，底层统一连接 PostgreSQL、pgvector 与文件存储。

RAG 聊天问答链路图

RAG 聊天问答链路图

展示一次问答请求的完整流转：结合会话历史完成问题改写，执行 Dense + BM25 + RRF 的混合检索，再通过 Rerank 与相关性守卫筛选证据，最后生成答案、构建引用并输出调试信息。

RAG 异步建库图

RAG 异步建库图

展示文档上传后的异步处理流程：接口负责保存记录与入队，Redis + Celery 驱动 Worker 完成文件保存、解析清洗、切片、Embedding、Chunk 入库与 BM25 索引构建，并支持失败记录与任务重试。

共享状态 / 数据流图

共享状态 / 数据流图

state 里放的是“会影响后续决策和可观测性”的信息，比如用户问题、改写问题、召回 chunk、相关度判断结果、最终答案、引用结构、会话 id

提示词设计

提示词设计

展示问答链路中的提示词分层设计，包括问题改写、回答生成、拒答约束与引用输出规范，核心目标是降低幻觉、统一回答格式并增强面向知识库场景的可控性。

AI 代码规范与验收闭环图

AI 代码规范与验收闭环图

展示从需求拆解、代码生成、规范约束、结果校验到最终验收的闭环流程，用于说明项目中如何把 AI 辅助开发与工程质量控制结合起来，而不是只停留在生成代码层面。

多 Agent 演进图

多 Agent 演进图

展示系统从单链路问答向多 Agent 协作能力演进的思路，包括任务拆分、角色分工、状态共享与后续扩展方向，用于说明当前能力边界及未来可演进空间。