核心差异
RAG 和 Compiled Wiki 代表了两种不同的"LLM + 知识"范式,它们在知识的存储、组织和利用方式上存在根本差异。
RAG 的工作方式
RAG(Retrieval-Augmented Generation)的工作流程是:
- 用户提出查询
- 系统将查询转换为向量,在知识库中检索相关文档片段
- 将检索结果作为上下文注入 Prompt
- LLM 基于注入的上下文生成回答
2026/5/29大约 3 分钟
RAG 和 Compiled Wiki 代表了两种不同的"LLM + 知识"范式,它们在知识的存储、组织和利用方式上存在根本差异。
RAG(Retrieval-Augmented Generation)的工作流程是:
RAG(Retrieval-Augmented Generation)是一种将外部知识检索与 LLM 生成能力相结合的技术范式。它通过在推理时动态检索相关文档,将检索结果注入 prompt 上下文,从而让模型在不修改参数的情况下获取最新、特定的知识。
RAG 的工作流程分为两个核心阶段: