GPT(OpenAI)、Claude(Anthropic)和 Gemini(Google)是 2026 年最具影响力的三大 LLM 产品线。它们各有侧重,理解差异有助于在不同场景下做出最优选择。
Claude 是由 entities/anthropic 开发的大语言模型 AI 助手系列,以安全性、有用性和诚实性为设计原则。Claude 系列模型在长上下文理解、代码生成、多模态处理等方面具有行业领先的能力。
简介
Claude 的命名灵感来源于信息论之父 Claude Shannon,象征着对语言理解和信息处理的追求。作为 Anthropic 的核心产品,Claude 体现了公司在 AI 安全领域的深厚积累——通过 Constitutional AI 方法,Claude 在保持高能力的同时展现出业界领先的安全性和可控性。
OpenAI 的 Generative Pre-trained Transformer 系列,定义了大语言模型的技术范式。
简介
GPT(Generative Pre-trained Transformer)是 OpenAI 开发的大语言模型系列,基于 Transformer 架构 的 Decoder 部分。从 2018 年的 GPT-1 到 2024 年的 GPT-4o,每一代都在规模和能力上实现了质的飞跃,深刻塑造了整个 AI 行业的技术路线。
本地大语言模型运行工具,让开发者在个人设备上轻松部署和运行开源 LLM。
简介
Ollama 是一个开源的本地 LLM 运行框架,以极简的命令行界面让用户在 macOS、Linux 和 Windows 上运行各种开源大语言模型。它自动处理模型下载、GPU 加速和量化,大幅降低了本地部署的门槛。
支持的模型
Ollama 支持丰富的开源模型家族:
- LLaMA 系列:Meta 的 LLaMA 2/3/3.1/4 全系列
- Mistral:Mistral AI 的 Mistral 和 Mixtral 系列
- Gemma:Google 的 Gemma 系列开源模型
- Qwen:阿里的通义千问系列
- DeepSeek:深度求索系列
- Phi:Microsoft 的小参数高性能模型
领先的 AI 研究与部署公司,GPT 系列和 ChatGPT 的创造者。
简介
OpenAI 于 2015 年由 Sam Altman、Elon Musk、Ilya Sutskever 等人共同创立,初始使命是确保通用人工智能(AGI)造福全人类。总部位于旧金山,是目前全球最具影响力的 AI 公司之一。
核心产品与模型
GPT 系列
GPT 系列是 OpenAI 的旗舰产品线,从 GPT-1 到 GPT-4o,每一代都在语言理解和生成能力上实现显著跃迁。ChatGPT(2022 年 12 月发布)标志着大语言模型走向大众,两个月内用户突破一亿。
本指南覆盖 微调 的完整流程,从数据准备到模型部署。微调是将通用 LLM 适配到特定领域或任务的关键技术。
数据准备
数据质量决定微调效果的上限。核心要求:
- 格式统一:通常使用对话格式(
system/user/assistant),确保与目标模型的训练格式一致 - 质量优先:500 条高质量样本远胜 5000 条低质量样本。每条数据应经过人工审核
- 多样性:覆盖目标任务的各类场景和输入分布,避免数据偏斜导致模型偏向某种回答模式
- 去重:去除重复或高度相似的样本,防止模型过拟合
定义
AI Agent(智能体)是以大语言模型(LLM)作为推理引擎,结合工具调用能力和自主决策机制,能够完成复杂任务的软件系统。与传统聊天机器人不同,AI Agent 不仅回答问题,还能主动规划步骤、调用外部工具、根据反馈调整策略,最终达成目标。
Andrej Karpathy 将当前阶段概括为 "vibe coding" 时代——人类提供意图,AI Agent 负责执行。这一范式的核心正是 Agent 架构。
核心组件
一个典型的 AI Agent 系统包含四个关键模块:
- 规划(Planning):将复杂目标拆解为可执行的子任务序列。常见策略包括 Chain-of-Thought、Tree-of-Thought 和 LATS(Language Agent Tree Search)。
- 记忆(Memory):分为短期记忆(上下文窗口内的对话历史)和长期记忆(向量数据库、知识库等持久化存储)。记忆机制使 Agent 能够在多轮交互中保持连贯性。
- 工具(Tools):Agent 通过 Function Calling 调用外部工具——搜索引擎、代码执行器、文件系统、API 接口等。工具扩展了 LLM 的能力边界,使其不再局限于文本生成。
- 行动(Action):将规划结果转化为具体操作,执行后收集反馈,驱动下一轮决策循环。
Chain-of-Thought(CoT,思维链)是一种通过引导 LLM 逐步展开中间推理步骤来提升复杂任务表现的 concepts/prompt-engineering 技术。其核心观察是:当模型被要求"展示推理过程"而非直接给出答案时,在数学、逻辑和多步推理任务上的准确率显著提升。
Zero-shot CoT
Kojima 等人发现,仅需在提示末尾添加 "Let's think step by step",就能在无示例的情况下激活模型的推理能力。这种 Zero-shot CoT 方法无需构造复杂的示例,使用成本极低,适用于快速验证推理任务。其效果在不同模型上差异较大,通常在较大参数量(100B+)的模型上表现更稳定。
微调是指在预训练模型的基础上,使用特定领域或任务的数据继续训练模型参数,使模型适应下游需求的过程。它是 concepts/llm-training-pipeline 中连接预训练与实际应用的关键环节。
全量微调 vs 参数高效微调
全量微调(Full Fine-Tuning) 更新模型的所有参数。效果通常最好,但显存需求极高(需要存储完整模型梯度和优化器状态),对于 70B+ 参数的大模型,实际部署成本往往不可承受。
Function Calling(函数调用)是指 LLM 根据用户请求,输出结构化的工具调用请求(而非纯文本回复)的能力。它使 LLM 能够与外部系统交互——执行搜索、查询数据库、调用 API——从而突破模型自身知识和能力的边界。
工作原理
开发者通过 JSON Schema 描述可用函数的名称、参数和语义,连同用户消息一起发送给模型。模型分析用户意图后,可以选择生成一个结构化的函数调用请求(包含函数名和参数),而非直接生成文本回复。客户端执行实际函数调用后,将结果返回给模型,模型再基于结果生成最终回复。
与 MCP 的关系
concepts/model-context-protocol(MCP)是 Function Calling 的标准化协议层。MCP 定义了模型与工具之间的统一通信标准,使工具可以跨不同 LLM 提供商复用。MCP 的设计理念是:任何符合 MCP 规范的工具服务器,都可以被任何支持 MCP 的 LLM 客户端使用,避免了工具集成为每个模型重复开发的问题。