Enterprise Project

企业级 AI 知识库问答平台(RAG)

LangGraphLLMRAGHybrid SearchFastAPINext.jsPostgreSQLpgvectorRedisCelery
Source Code
Project Media

Overview

面向企业知识管理场景,搭建基于 LangGraph 编排的 Hybrid / Workflow RAG 知识库平台,支持文档异步入库、多路检索、流式问答、引用溯源与调试分析。

Key Contributions

  • 01

    RAG 工作流(Workflow RAG)基于 LangGraph 重构问答链路,将问题改写、多路召回、重排、相关性判断、答案生成与引用构建拆分为独立节点,提升系统健壮性与可观测性。

  • 02

    混合检索与重排(Hybrid Search)构建 Dense (pgvector) + Sparse (BM25) 双路召回,引入 Rerank 模型语义重排,解决垂直领域专有名词召回率低、单路检索不稳定的问题。

  • 03

    阈值控制与溯源设计相关性阈值兜底与拒答策略,并实现细粒度 Citations(溯源至文档 Chunk 与摘要),提升答案可信度与可解释性。

  • 04

    前后端架构基于 Python (FastAPI) + SQLAlchemy 开发后端核心业务,基于 React (Next.js) + TypeScript 搭建智能问答工作台、知识库管理页面与调试面板。

Architecture & Design

RAG 整体架构图

RAG 整体架构图

展示系统整体分层与模块协作关系:前端由 Next.js 承载交互,FastAPI 作为统一接入层,对内拆分为 LangGraph 在线问答链路与 Redis + Celery 异步建库链路,底层统一连接 PostgreSQL、pgvector 与文件存储。

RAG 聊天问答链路图

RAG 聊天问答链路图

展示一次问答请求的完整流转:结合会话历史完成问题改写,执行 Dense + BM25 + RRF 的混合检索,再通过 Rerank 与相关性守卫筛选证据,最后生成答案、构建引用并输出调试信息。

RAG 异步建库图

RAG 异步建库图

展示文档上传后的异步处理流程:接口负责保存记录与入队,Redis + Celery 驱动 Worker 完成文件保存、解析清洗、切片、Embedding、Chunk 入库与 BM25 索引构建,并支持失败记录与任务重试。

共享状态 / 数据流图

共享状态 / 数据流图

state 里放的是“会影响后续决策和可观测性”的信息,比如用户问题、改写问题、召回 chunk、相关度判断结果、最终答案、引用结构、会话 id

提示词设计

提示词设计

展示问答链路中的提示词分层设计,包括问题改写、回答生成、拒答约束与引用输出规范,核心目标是降低幻觉、统一回答格式并增强面向知识库场景的可控性。

AI 代码规范与验收闭环图

AI 代码规范与验收闭环图

展示从需求拆解、代码生成、规范约束、结果校验到最终验收的闭环流程,用于说明项目中如何把 AI 辅助开发与工程质量控制结合起来,而不是只停留在生成代码层面。

多 Agent 演进图

多 Agent 演进图

展示系统从单链路问答向多 Agent 协作能力演进的思路,包括任务拆分、角色分工、状态共享与后续扩展方向,用于说明当前能力边界及未来可演进空间。