所有项目
维护中 2024

RAG 知识库助手

基于检索增强生成的企业文档问答系统

项目背景

企业内部文档散落在多个系统,员工查找信息效率极低。构建了一套 RAG 问答系统,让员工用自然语言查询内部知识库。

核心功能

  • 文档解析:支持 PDF、Word、Markdown、HTML 等格式
  • 混合检索:向量检索 + BM25 倒排索引 + RRF 融合排序
  • Cross-encoder Reranker 对召回结果重排序,准确率提升 30%
  • 流式响应,首字符延迟 < 500ms
  • 全链路可观测:LangFuse 追踪每次 LLM 调用

性能指标

指标数值
答案忠实度 (Faithfulness)87%
召回准确率 (Recall@5)91%
P90 端到端延迟2.8s
日均 QPS200+

技术挑战

多轮对话的 token 管理:通过动态历史压缩策略,在不超出 context 限制的前提下保持对话连贯性。