用 LLM Wiki 的"编译"思想替代 Dify 的自动解析,砍掉不稳定的分类环节,大幅提升输出质量。
问题诊断
当前工作流存在三个连锁问题:
- Dify 文档解析差 — 自动分段产生信息碎片,缺乏上下文
- LLM 问题分类不稳定 — 同一个问题可能被分到不同类别,下游检索随之偏移
- 输出不稳定 — 垃圾片段进 → 垃圾回答出
2026/5/30大约 5 分钟
用 LLM Wiki 的"编译"思想替代 Dify 的自动解析,砍掉不稳定的分类环节,大幅提升输出质量。
当前工作流存在三个连锁问题:
RAG 和 Compiled Wiki 代表了两种不同的"LLM + 知识"范式,它们在知识的存储、组织和利用方式上存在根本差异。
RAG(Retrieval-Augmented Generation)的工作流程是:
本指南从工程实践角度讲解如何构建 RAG(检索增强生成) 系统,覆盖文档处理到质量评估的完整链路。
文档分块(Chunking)是 RAG 效果的基础:
RAG(Retrieval-Augmented Generation)是一种将外部知识检索与 LLM 生成能力相结合的技术范式。它通过在推理时动态检索相关文档,将检索结果注入 prompt 上下文,从而让模型在不修改参数的情况下获取最新、特定的知识。
RAG 的工作流程分为两个核心阶段: