2025全栈架构与开发

AI 知识库问答平台

FastAPINext.jsPostgreSQLpgvectorRAG
AI 知识库问答平台

Overview

该项目旨在解决企业内部海量非结构化文档的检索与问答难题。通过构建基于大语言模型(LLM)和检索增强生成(RAG)技术的知识库问答平台,员工可以通过自然语言提问,系统自动从企业知识库中检索相关片段,并生成带有引用溯源的准确回答。

Challenges

  • 01

    复杂文档解析:PDF、Word 等格式中包含大量表格、图片和复杂排版,传统解析工具容易丢失上下文。

  • 02

    检索准确率:单纯的向量检索在特定专业术语和长尾问题上表现不佳。

  • 03

    流式响应体验:LLM 生成速度较慢,需要通过 SSE 实现打字机效果,同时保证引用溯源数据的同步返回。

Solutions

  • 01

    采用基于视觉的文档解析方案(如 Unstructured / 结合多模态模型),提取结构化文本并保留层级关系。

  • 02

    引入混合检索(Hybrid Search):结合 BM25 关键词检索与 pgvector 向量检索,并通过 Reranker 模型进行重排,大幅提升 Top-K 召回质量。

  • 03

    基于 FastAPI 实现全链路异步流式接口(SSE),前端使用 Vercel AI SDK 消费流数据,实现丝滑的对话体验。

Architecture Design

AI 知识库问答平台 Architecture