Fine-Tuning

zhuonixian2026/5/29大约 2 分钟

微调（Fine-Tuning）

微调是指在预训练模型的基础上，使用特定领域或任务的数据继续训练模型参数，使模型适应下游需求的过程。它是 concepts/llm-training-pipeline 中连接预训练与实际应用的关键环节。

全量微调 vs 参数高效微调

全量微调（Full Fine-Tuning） 更新模型的所有参数。效果通常最好，但显存需求极高（需要存储完整模型梯度和优化器状态），对于 70B+ 参数的大模型，实际部署成本往往不可承受。

LoRA（Low-Rank Adaptation） 是当前最流行的参数高效微调方法。其核心思想是冻结原始权重矩阵 $W$，仅训练低秩分解矩阵 $\Delta W = AB$（其中 $A \in \mathbb{R}^{d \times r}$，$B \in \mathbb{R}^{r \times d}$，$r \ll d$），将可训练参数量降低几个数量级。推理时将 $\Delta W$ 合并回 $W$，不增加推理延迟。

QLoRA 在 LoRA 基础上引入 4-bit NormalFloat 量化和分页优化器，使 65B 模型的微调可在单张 48GB GPU 上完成，大幅降低了微调的硬件门槛。

Adapter 在 Transformer 层中插入小型前馈模块，仅训练 Adapter 参数。虽然比 LoRA 多一些推理开销，但在多任务切换场景下更具灵活性。

Fine-Tuning

微调（Fine-Tuning）

全量微调 vs 参数高效微调

监督微调（SFT）流程

领域适应微调

数据质量要求

相关页面