标签: llm

GPT（OpenAI）、Claude（Anthropic）和 Gemini（Google）是 2026 年最具影响力的三大 LLM 产品线。它们各有侧重，理解差异有助于在不同场景下做出最优选择。

背景与定位

GPT：OpenAI 的旗舰系列，最早定义了大规模语言模型的产品形态，拥有最大的用户基数和插件生态。
Claude：Anthropic 出品，以安全性和长文本处理著称，在技术文档理解和代码生成方面表现突出。
Gemini：Google DeepMind 的多模态模型，深度整合 Google 搜索和 Workspace 生态，原生支持文本、图像、音频和视频。

zhuonixian2026/5/29大约 2 分钟

Claude 是由 entities/anthropic 开发的大语言模型 AI 助手系列，以安全性、有用性和诚实性为设计原则。Claude 系列模型在长上下文理解、代码生成、多模态处理等方面具有行业领先的能力。

简介

Claude 的命名灵感来源于信息论之父 Claude Shannon，象征着对语言理解和信息处理的追求。作为 Anthropic 的核心产品，Claude 体现了公司在 AI 安全领域的深厚积累——通过 Constitutional AI 方法，Claude 在保持高能力的同时展现出业界领先的安全性和可控性。

zhuonixian2026/5/29大约 3 分钟

GPT

OpenAI 的 Generative Pre-trained Transformer 系列，定义了大语言模型的技术范式。

简介

GPT（Generative Pre-trained Transformer）是 OpenAI 开发的大语言模型系列，基于 Transformer 架构的 Decoder 部分。从 2018 年的 GPT-1 到 2024 年的 GPT-4o，每一代都在规模和能力上实现了质的飞跃，深刻塑造了整个 AI 行业的技术路线。

zhuonixian2026/5/29大约 2 分钟

Ollama

本地大语言模型运行工具，让开发者在个人设备上轻松部署和运行开源 LLM。

简介

Ollama 是一个开源的本地 LLM 运行框架，以极简的命令行界面让用户在 macOS、Linux 和 Windows 上运行各种开源大语言模型。它自动处理模型下载、GPU 加速和量化，大幅降低了本地部署的门槛。

支持的模型

Ollama 支持丰富的开源模型家族：

LLaMA 系列：Meta 的 LLaMA 2/3/3.1/4 全系列
Mistral：Mistral AI 的 Mistral 和 Mixtral 系列
Gemma：Google 的 Gemma 系列开源模型
Qwen：阿里的通义千问系列
DeepSeek：深度求索系列
Phi：Microsoft 的小参数高性能模型

zhuonixian2026/5/29大约 1 分钟

OpenAI

领先的 AI 研究与部署公司，GPT 系列和 ChatGPT 的创造者。

简介

OpenAI 于 2015 年由 Sam Altman、Elon Musk、Ilya Sutskever 等人共同创立，初始使命是确保通用人工智能（AGI）造福全人类。总部位于旧金山，是目前全球最具影响力的 AI 公司之一。

核心产品与模型

GPT 系列

GPT 系列是 OpenAI 的旗舰产品线，从 GPT-1 到 GPT-4o，每一代都在语言理解和生成能力上实现显著跃迁。ChatGPT（2022 年 12 月发布）标志着大语言模型走向大众，两个月内用户突破一亿。

zhuonixian2026/5/29大约 2 分钟

如何微调大语言模型

本指南覆盖微调的完整流程，从数据准备到模型部署。微调是将通用 LLM 适配到特定领域或任务的关键技术。

数据准备

数据质量决定微调效果的上限。核心要求：

格式统一：通常使用对话格式（system/user/assistant），确保与目标模型的训练格式一致
质量优先：500 条高质量样本远胜 5000 条低质量样本。每条数据应经过人工审核
多样性：覆盖目标任务的各类场景和输入分布，避免数据偏斜导致模型偏向某种回答模式
去重：去除重复或高度相似的样本，防止模型过拟合

zhuonixian2026/5/29大约 3 分钟

AI Agents

定义

AI Agent（智能体）是以大语言模型（LLM）作为推理引擎，结合工具调用能力和自主决策机制，能够完成复杂任务的软件系统。与传统聊天机器人不同，AI Agent 不仅回答问题，还能主动规划步骤、调用外部工具、根据反馈调整策略，最终达成目标。

Andrej Karpathy 将当前阶段概括为 "vibe coding" 时代——人类提供意图，AI Agent 负责执行。这一范式的核心正是 Agent 架构。

核心组件

一个典型的 AI Agent 系统包含四个关键模块：

规划（Planning）：将复杂目标拆解为可执行的子任务序列。常见策略包括 Chain-of-Thought、Tree-of-Thought 和 LATS（Language Agent Tree Search）。
记忆（Memory）：分为短期记忆（上下文窗口内的对话历史）和长期记忆（向量数据库、知识库等持久化存储）。记忆机制使 Agent 能够在多轮交互中保持连贯性。
工具（Tools）：Agent 通过 Function Calling 调用外部工具——搜索引擎、代码执行器、文件系统、API 接口等。工具扩展了 LLM 的能力边界，使其不再局限于文本生成。
行动（Action）：将规划结果转化为具体操作，执行后收集反馈，驱动下一轮决策循环。

zhuonixian2026/5/29大约 3 分钟

Chain-of-Thought

Chain-of-Thought（CoT，思维链）是一种通过引导 LLM 逐步展开中间推理步骤来提升复杂任务表现的 concepts/prompt-engineering 技术。其核心观察是：当模型被要求"展示推理过程"而非直接给出答案时，在数学、逻辑和多步推理任务上的准确率显著提升。

Zero-shot CoT

Kojima 等人发现，仅需在提示末尾添加 "Let's think step by step"，就能在无示例的情况下激活模型的推理能力。这种 Zero-shot CoT 方法无需构造复杂的示例，使用成本极低，适用于快速验证推理任务。其效果在不同模型上差异较大，通常在较大参数量（100B+）的模型上表现更稳定。

zhuonixian2026/5/29大约 2 分钟

Fine-Tuning

微调是指在预训练模型的基础上，使用特定领域或任务的数据继续训练模型参数，使模型适应下游需求的过程。它是 concepts/llm-training-pipeline 中连接预训练与实际应用的关键环节。

全量微调 vs 参数高效微调

全量微调（Full Fine-Tuning） 更新模型的所有参数。效果通常最好，但显存需求极高（需要存储完整模型梯度和优化器状态），对于 70B+ 参数的大模型，实际部署成本往往不可承受。

zhuonixian2026/5/29大约 2 分钟

Function Calling

Function Calling（函数调用）是指 LLM 根据用户请求，输出结构化的工具调用请求（而非纯文本回复）的能力。它使 LLM 能够与外部系统交互——执行搜索、查询数据库、调用 API——从而突破模型自身知识和能力的边界。

工作原理

开发者通过 JSON Schema 描述可用函数的名称、参数和语义，连同用户消息一起发送给模型。模型分析用户意图后，可以选择生成一个结构化的函数调用请求（包含函数名和参数），而非直接生成文本回复。客户端执行实际函数调用后，将结果返回给模型，模型再基于结果生成最终回复。

与 MCP 的关系

concepts/model-context-protocol（MCP）是 Function Calling 的标准化协议层。MCP 定义了模型与工具之间的统一通信标准，使工具可以跨不同 LLM 提供商复用。MCP 的设计理念是：任何符合 MCP 规范的工具服务器，都可以被任何支持 MCP 的 LLM 客户端使用，避免了工具集成为每个模型重复开发的问题。

zhuonixian2026/5/29大约 2 分钟