构建 LLM Wiki 指南
构建 LLM Wiki 指南
本指南将带你从零开始构建一个由 LLM Agent 驱动的个人知识库。
前置条件
- LLM Agent:Claude Code、OpenAI Codex 或其他支持文件操作和工具调用的 LLM Agent
- Obsidian:本地 Markdown 编辑器,用于浏览和维护知识库
- Git(可选):用于版本控制和协作
核心思路是:让 LLM Agent 作为你的知识助手,在 Obsidian 知识库中持续编写和维护结构化页面。
步骤一:创建三层目录结构
LLM Wiki 采用三层架构组织知识:
wiki/
├── concepts/ # 概念层:技术概念的深度解析
├── entities/ # 实体层:人物、产品、组织的介绍
├── guides/ # 指南层:操作指南和教程
├── comparisons/ # 对比层:技术方案和工具的对比分析
├── topics/ # 主题层:综合性主题页面
├── synthesis/ # 综合层:跨领域综合分析
└── templates/ # 模板层:页面模板每一层有不同的粒度和目的:实体是知识的最小单元,主题是多个实体的聚合,综合分析是跨领域的深度思考。
步骤二:编写 CLAUDE.md Schema
在项目根目录创建 CLAUDE.md 文件,定义 LLM Agent 的工作规范:
- 目录结构和命名约定
- 页面格式要求(YAML frontmatter + Markdown 正文)
- 双向链接的使用规范(
[xxx/yyy](/posts/wiki/xxx/yyy.html)格式) - 页面间引用的约定
- 内容质量标准(准确性、结构化、适当深度)
这个文件是 LLM Agent 的"宪法",确保它在多轮交互中保持一致的输出质量。
步骤三:创建页面模板
在 wiki/templates/ 中为每类页面创建模板,包含预设的 frontmatter 字段和内容结构。模板确保所有页面风格一致,也降低了 Agent 的生成复杂度。
步骤四:摄取第一批资料
选择 3-5 个你熟悉的核心主题,收集相关的原始资料(博客文章、论文、技术文档),然后让 LLM Agent 将这些资料编译为结构化的 Wiki 页面。
关键原则:不要让 Agent 简单复制粘贴原文,而是要求它理解、综合、用自己的语言重新表达。编译过程本身就是知识消化。
步骤五:建立交叉引用
页面创建后,检查并添加双向链接。每个页面至少应该引用 2-3 个相关页面。交叉引用是知识图谱的边,它使孤立的知识点连接成网络。
Obsidian 的关系图(Graph View)是验证交叉引用质量的好工具——健康的知识图谱应该是互联的,而非多个孤岛。
维护工作流:Ingest → Query → Lint
LLM Wiki 的日常维护遵循三个核心流程:
- Ingest(摄取):将新的原始资料编译为 Wiki 页面,或更新现有页面。这是知识增长的主要方式。
- Query(查询):向 LLM Agent 提问,Agent 基于已有 Wiki 内容回答。查询过程也可能触发知识更新。
- Lint(校验):定期检查页面质量——过期信息、断链、格式不一致等。类似代码库的 Lint,保持知识库的健康度。
最佳实践
- 原子化原则:每个页面聚焦一个主题,避免信息过载
- 定期回顾:每周花 15 分钟浏览关系图,发现知识缺口
- 渐进式建设:不要试图一次性构建完整知识库,从核心主题开始自然生长
- 人机协作:LLM Agent 编写初稿,人类审核和补充,形成良性循环
- 版本控制:用 Git 追踪知识库的变化,方便回溯和协作
常见问题
Q:需要多少原始资料才能开始?
A:5-10 篇高质量文章就足以启动第一个主题的知识编译。
Q:知识库多大才算有用?
A:50-100 个页面的知识库已经能提供显著的查询价值。质量比数量更重要。
Q:如何处理过时信息?
A:在 frontmatter 中设置 status 字段标记页面状态,定期 Lint 时更新过时内容。
相关页面
- Andrej Karpathy:LLM Wiki 理念的提出者
- 知识管理:知识管理的理论与实践背景