定义
AI Agent(智能体)是以大语言模型(LLM)作为推理引擎,结合工具调用能力和自主决策机制,能够完成复杂任务的软件系统。与传统聊天机器人不同,AI Agent 不仅回答问题,还能主动规划步骤、调用外部工具、根据反馈调整策略,最终达成目标。
Andrej Karpathy 将当前阶段概括为 "vibe coding" 时代——人类提供意图,AI Agent 负责执行。这一范式的核心正是 Agent 架构。
核心组件
一个典型的 AI Agent 系统包含四个关键模块:
- 规划(Planning):将复杂目标拆解为可执行的子任务序列。常见策略包括 Chain-of-Thought、Tree-of-Thought 和 LATS(Language Agent Tree Search)。
- 记忆(Memory):分为短期记忆(上下文窗口内的对话历史)和长期记忆(向量数据库、知识库等持久化存储)。记忆机制使 Agent 能够在多轮交互中保持连贯性。
- 工具(Tools):Agent 通过 Function Calling 调用外部工具——搜索引擎、代码执行器、文件系统、API 接口等。工具扩展了 LLM 的能力边界,使其不再局限于文本生成。
- 行动(Action):将规划结果转化为具体操作,执行后收集反馈,驱动下一轮决策循环。