本指南从工程实践角度讲解如何构建 RAG(检索增强生成) 系统,覆盖文档处理到质量评估的完整链路。
文档加载和分块
文档分块(Chunking)是 RAG 效果的基础:
- 固定长度分块:按 token 数(通常 256-1024)切分,简单但可能切断语义完整段落
- 语义分块:按段落或章节边界切分,保持语义完整性,推荐作为首选策略
- 递归分块:先按大单位(章节)切分,再对过长段落递归切分,兼顾粒度和完整性
- 重叠窗口:相邻块之间保留 10-20% 的重叠内容,避免关键信息恰好在切分边界被截断
2026/5/29大约 3 分钟