构建 LLM Wiki 指南

zhuonixian2026/5/29大约 4 分钟

构建 LLM Wiki 指南

本指南将带你从零开始构建一个由 LLM Agent 驱动的个人知识库。

前置条件

LLM Agent：Claude Code、OpenAI Codex 或其他支持文件操作和工具调用的 LLM Agent
Obsidian：本地 Markdown 编辑器，用于浏览和维护知识库
Git（可选）：用于版本控制和协作

核心思路是：让 LLM Agent 作为你的知识助手，在 Obsidian 知识库中持续编写和维护结构化页面。

步骤一：创建三层目录结构

LLM Wiki 采用三层架构组织知识：

wiki/
├── concepts/     # 概念层：技术概念的深度解析
├── entities/     # 实体层：人物、产品、组织的介绍
├── guides/       # 指南层：操作指南和教程
├── comparisons/  # 对比层：技术方案和工具的对比分析
├── topics/       # 主题层：综合性主题页面
├── synthesis/    # 综合层：跨领域综合分析
└── templates/    # 模板层：页面模板

每一层有不同的粒度和目的：实体是知识的最小单元，主题是多个实体的聚合，综合分析是跨领域的深度思考。

步骤二：编写 CLAUDE.md Schema

在项目根目录创建 CLAUDE.md 文件，定义 LLM Agent 的工作规范：

目录结构和命名约定
页面格式要求（YAML frontmatter + Markdown 正文）
双向链接的使用规范（[xxx/yyy](/posts/wiki/xxx/yyy.html) 格式）
页面间引用的约定
内容质量标准（准确性、结构化、适当深度）

这个文件是 LLM Agent 的"宪法"，确保它在多轮交互中保持一致的输出质量。

步骤三：创建页面模板

在 wiki/templates/ 中为每类页面创建模板，包含预设的 frontmatter 字段和内容结构。模板确保所有页面风格一致，也降低了 Agent 的生成复杂度。

步骤四：摄取第一批资料

选择 3-5 个你熟悉的核心主题，收集相关的原始资料（博客文章、论文、技术文档），然后让 LLM Agent 将这些资料编译为结构化的 Wiki 页面。

关键原则：不要让 Agent 简单复制粘贴原文，而是要求它理解、综合、用自己的语言重新表达。编译过程本身就是知识消化。

步骤五：建立交叉引用

页面创建后，检查并添加双向链接。每个页面至少应该引用 2-3 个相关页面。交叉引用是知识图谱的边，它使孤立的知识点连接成网络。

Obsidian 的关系图（Graph View）是验证交叉引用质量的好工具——健康的知识图谱应该是互联的，而非多个孤岛。

维护工作流：Ingest → Query → Lint

LLM Wiki 的日常维护遵循三个核心流程：

Ingest（摄取）：将新的原始资料编译为 Wiki 页面，或更新现有页面。这是知识增长的主要方式。
Query（查询）：向 LLM Agent 提问，Agent 基于已有 Wiki 内容回答。查询过程也可能触发知识更新。
Lint（校验）：定期检查页面质量——过期信息、断链、格式不一致等。类似代码库的 Lint，保持知识库的健康度。

最佳实践

原子化原则：每个页面聚焦一个主题，避免信息过载
定期回顾：每周花 15 分钟浏览关系图，发现知识缺口
渐进式建设：不要试图一次性构建完整知识库，从核心主题开始自然生长
人机协作：LLM Agent 编写初稿，人类审核和补充，形成良性循环
版本控制：用 Git 追踪知识库的变化，方便回溯和协作

常见问题

Q：需要多少原始资料才能开始？
A：5-10 篇高质量文章就足以启动第一个主题的知识编译。

Q：知识库多大才算有用？
A：50-100 个页面的知识库已经能提供显著的查询价值。质量比数量更重要。

Q：如何处理过时信息？
A：在 frontmatter 中设置 status 字段标记页面状态，定期 Lint 时更新过时内容。

相关页面

Andrej Karpathy：LLM Wiki 理念的提出者
知识管理：知识管理的理论与实践背景