标签: rag

用 LLM Wiki 的"编译"思想替代 Dify 的自动解析，砍掉不稳定的分类环节，大幅提升输出质量。

问题诊断

当前工作流存在三个连锁问题：

zhuonixian2026/5/30大约 5 分钟

RAG 和 Compiled Wiki 代表了两种不同的"LLM + 知识"范式，它们在知识的存储、组织和利用方式上存在根本差异。

RAG（Retrieval-Augmented Generation）的工作流程是：

zhuonixian2026/5/29大约 3 分钟

本指南从工程实践角度讲解如何构建 RAG（检索增强生成）系统，覆盖文档处理到质量评估的完整链路。

文档分块（Chunking）是 RAG 效果的基础：

zhuonixian2026/5/29大约 3 分钟

RAG（Retrieval-Augmented Generation）是一种将外部知识检索与 LLM 生成能力相结合的技术范式。它通过在推理时动态检索相关文档，将检索结果注入 prompt 上下文，从而让模型在不修改参数的情况下获取最新、特定的知识。

RAG 的工作流程分为两个核心阶段：

检索（Retrieval）：用户查询经过 embedding 模型编码为向量，在向量数据库（如 Pinecone、Milvus、Weaviate）中进行语义搜索，找到最相关的文档片段。语义搜索相比关键词匹配能更好地理解查询意图。
生成（Generation）：检索到的文档片段作为上下文，与用户查询一起送入 LLM，由模型基于这些上下文生成回答。

zhuonixian2026/5/29大约 2 分钟