🚀 RAG对话系统

📋 目录

项目简介
核心特性
项目架构
项目演示
快速开始
技术栈
项目结构
API 文档
配置说明
部署指南
开发指南
故障排除
文档
联系方式

项目简介

基于 FastAPI + LangChain 构建的企业级智能对话系统，集成先进的 RAG（检索增强生成） 技术，能够基于文档内容提供高精度的智能问答服务。系统采用微服务架构，具备会话持久化、多语言支持和模块化设计等特性。

核心特性

智能问答 💬：基于 RAG 技术，结合文档检索和大语言模型，提供精准的问答体验
会话持久化 💾：使用 MySQL 存储会话历史，支持长期保存和回溯
多语言支持 🌐：前端集成 i18n，支持中英文界面切换
文档管理 📄：前端可视化文档上传、管理(查看细致的切片、原文档等信息)
安全性 ⛑️：对不同用户的知识库进行隔离，RAG检索只能检索到自己上传的文档
微服务架构 🏗️：分离的用户服务和对话服务，易于扩展和维护
高性能 ⚡：基于 FastAPI 和 ChromaDB，提供卓越的性能表现

项目架构

flowchart TD
    subgraph "前端层"
        A["用户界面 (Vue 3)"] -->|发送查询| B["API请求 (Axios)"]
        C["会话管理 (Pinia)"] -->|状态管理| B
        D["用户认证 (Vue Router)"] -->|路由守卫| B
    end

    subgraph "API路由层"
        B -->|REST API| E["聊天路由 (FastAPI)"]
        E -->|认证| F["认证中间件 (JWT)"]
        E -->|限流| G["限流控制 (Redis)"]
    end

    subgraph "业务服务层"
        E -->|代理查询| H["ChatService (Python)"]
        H -->|会话管理| I["SessionManager (MySQL)"]
        H -->|RAG检索| J["RagService (LangChain)"]
        H -->|向量存储| K["VectorStoreService (ChromaDB)"]
        H -->|智能代理| L["Agent (LangChain)"]
        H -->|文档重排序| M["ReorderService (Hugging Face)"]
    end

    subgraph "数据存储层"
        I -->|存储会话| N["MySQL数据库"]
        K -->|向量存储| O["ChromaDB向量库"]
        K -->|文件存储| P["文件系统"]
        G -->|缓存| Q["Redis缓存"]
    end

    subgraph "AI模型服务"
        L -->|LLM调用| R["DashScope API (Qwen3-Max)"]
        J -->|嵌入模型| S["文本嵌入 (text-embedding-v4)"]
        M -->|重排序模型| T["Qwen3-Reranker-0.6B"]
    end

    subgraph "用户服务"
        U["Django用户服务"] -->|认证授权| F
        U -->|用户管理| V["MySQL用户数据库"]
    end

项目演示

主要功能界面

功能模块	界面展示	功能说明
AI 聊天		基于 RAG 的智能问答界面，支持上下文对话和文档引用
聊天管理		会话历史管理，支持会话列表查看和切换
用户服务		用户注册、登录和个人信息管理
知识库管理		文档上传、查看和管理知识库
文档切片		可视化文档切片详情，支持查看切片内容

提示：点击图片可查看大图，所有界面均支持中英文切换

快速开始

环境要求

环境	版本推荐
Python	3.12+
uv	0.11.9
Node.js	16+

克隆项目

git clone https://github.com/RMA-MUN/LangChain-RAG-FastAPI-Service.git
cd LangChain-RAG-FastAPI-Service

安装依赖

后端依赖

cd backend
uv sync

前端依赖

cd front
npm install
# 或使用 pnpm
pnpm install

环境配置

创建后端环境变量文件

在 backend 目录下创建 .env 文件，参考 .env.example 文件填写配置：

# ==================== LLM 大模型配置 ====================
# LLM类型：ALIYUN | OLLAMA
LLM_TYPE=ALIYUN

# ==================== Ollama 配置 (LLM_TYPE=OLLAMA) ====================
OLLAMA_BASE_URL=http://localhost:11434
OLLAMA_MODEL_NAME=qwen3.5:0.8b

# ==================== 阿里云百炼配置 (LLM_TYPE=ALIYUN) ====================
ALIYUN_ACCESS_KEY_SECRET=your_api_key
ALIYUN_BASE_URL=https://dashscope.aliyuncs.com/compatible-mode/v1
CHAT_MODEL_NAME=qwen3-max

# ==================== 向量嵌入模型配置 ====================
EMBED_MODEL_TYPE=OLLAMA
TEXT_EMBEDDING_MODEL_NAME=qwen3-embedding:0.6b
ALIYUN_EMBED_MODEL_NAME=qwen3-embedding

# ==================== 数据库配置 ====================
MYSQL_USER=root
MYSQL_PASSWORD=root
MYSQL_HOST=localhost
MYSQL_PORT=3306
MYSQL_DATABASE=chat_history

REDIS_HOST=localhost
REDIS_PORT=6379
REDIS_DB=0

# ==================== 服务配置 ====================
DJANGO_API_URL=http://127.0.0.1:8001

# ==================== LangSmith 调试追踪 ====================
LANGCHAIN_TRACING_V2=true
LANGCHAIN_API_KEY=your_langsmith_api_key
LANGCHAIN_PROJECT=my-fastapi-langchain-project

# ==================== 重排序模型配置 ====================
RERANKER_MODEL_PATH=D:\Hugging_Face\models\Qwen3-Reranker-0.6B

# ==================== JWT 身份验证配置 ====================
SECRET_KEY=MY_JWT_SECRET_KEY
ALGORITHM=HS256

创建用户服务环境变量文件

在 DjangoUserService 目录下创建 .env 文件：

# JWT 配置
JWT_SECRET_KEY=YOUR_JWT_SECRET_KEY

# 数据库配置
DB_PORT=3306
DB_NAME=user_service
DB_USER=root
DB_PASSWORD=root
DB_HOST=localhost

# Celery 配置
CELERY_BROKER_URL=redis://localhost:6379/0
CELERY_RESULT_BACKEND=redis://localhost:6379/0
CELERY_TASK_TIME_LIMIT=300
CELERY_TASK_SOFT_TIME_LIMIT=250
CELERY_RESULT_EXPIRES=3600

# Redis 配置
REDIS_CACHE_URL=redis://localhost:6379/1

向量数据库配置

修改 backend/app/config/chroma.yaml 文件：

collection_name: rag_collection
persist_directory: data/chromadb
k: 3

data_path: data
md5_hex_store: data/md5_hex_store/md5_hex_store.txt
allow_knowledge_file_types: ["txt", "pdf"]

chunk_size: 200
chunk_overlap: 20
separators: ["\n\n", "\n", "。", "！", "？", "!", "?", " ", ""]

启动服务

服务	命令	端口
后端服务	`cd backend && uvicorn main:app --reload`	8000
前端服务	`cd front && npm run dev`	3000
用户服务	`cd DjangoUserService && uv run python manage.py runserver 8001`	8001
MySQL	`net start mysql`	3306
Redis	`redis-server` 或 `net start redis`	6379
Ollama	`ollama serve`	11434

技术栈

后端技术

技术	说明
FastAPI	高性能异步 Web 框架
LangChain	大语言模型应用开发框架
ChromaDB	轻量级向量数据库
Django	用户认证和管理系统
MySQL	关系型数据库
Redis	缓存数据库
DashScope API	大语言模型服务
Hugging Face	预训练模型服务
PyTorch	深度学习框架
Sentence-Transformers	句子嵌入库

前端技术

技术	说明
Vue 3	现代化前端框架
Vite	极速构建工具
Vue Router	路由管理
Pinia	状态管理
i18n	国际化支持

项目结构

├── backend/                  # FastAPI 后端服务
│   ├── app/                  # 应用代码
│   │   ├── agent/            # 智能代理模块
│   │   ├── config/           # 配置文件目录
│   │   ├── model/            # 数据模型定义
│   │   ├── prompt/           # 提示词模板
│   │   ├── rag/              # RAG 核心功能
│   │   ├── router/           # API 路由定义
│   │   ├── services/         # 业务服务层
│   │   └── utils/            # 工具函数
│   ├── data/                 # 数据存储目录
│   ├── main.py               # 应用入口文件
│   └── requirements.txt      # 后端依赖列表
├── front/                    # Vue 前端项目
│   ├── src/                  # 源代码
│   ├── public/               # 静态资源
│   └── package.json          # 前端依赖配置
├── DjangoUserService/        # Django 用户服务
└── README.md                 # 项目说明文档

API文档

FastAPI 后端 API

API 文档：详细的 API 接口文档
交互式文档：启动服务后访问自动生成的交互式文档

Django 用户服务 API

API 文档：详细的用户服务 API 文档
交互式文档：启动服务后访问用户服务 API 文档

部署指南

详细的部署说明请参考：部署指南

开发指南

代码结构说明

backend/app/rag/：RAG 核心功能，包括向量存储和检索
backend/app/agent/：智能代理，处理用户请求和对话逻辑
backend/app/services/：业务服务层，提供会话管理等功能
backend/app/utils/：工具函数，包括配置加载、文件处理等
front/src/views/：前端页面组件
front/src/components/：可复用的前端组件

开发流程

添加新功能
- 在对应的模块中添加代码
- 运行测试确保功能正常
- 更新相关文档
调试技巧
- 使用 FastAPI 的自动重载功能：uvicorn main:app --reload
- 使用 Vue 的热更新功能：npm run dev

故障排除

详细的故障排除指南请参考：故障排除

文档

项目文档位于 docs/ 目录：

ModelScope 模型配置：详细的模型下载和配置说明
故障排除：常见问题和解决方案
API 文档：后端 API 接口文档
用户服务 API：用户服务 API 文档

Star History

联系方式

如有任何问题或建议，欢迎在 GitHub 提交 issues 或联系作者：

Email: n3032747608@163.com
QQ: 3032747608

Name		Name	Last commit message	Last commit date
Latest commit History 162 Commits
DjangoUserService		DjangoUserService
backend		backend
docs		docs
front		front
images		images
.gitignore		.gitignore
README.md		README.md

Folders and files

Latest commit

History

Repository files navigation

🚀 RAG对话系统

📋 目录

项目简介

核心特性

项目架构

项目演示

主要功能界面

快速开始

环境要求

克隆项目

安装依赖

后端依赖

前端依赖

环境配置

创建后端环境变量文件

创建用户服务环境变量文件

向量数据库配置

启动服务

技术栈

后端技术

前端技术

项目结构

API文档

FastAPI 后端 API

Django 用户服务 API

部署指南

开发指南

代码结构说明

开发流程

故障排除

文档

Star History

联系方式

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases 5

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages