本指南覆盖 微调 的完整流程,从数据准备到模型部署。微调是将通用 LLM 适配到特定领域或任务的关键技术。
数据准备
数据质量决定微调效果的上限。核心要求:
- 格式统一:通常使用对话格式(
system/user/assistant),确保与目标模型的训练格式一致 - 质量优先:500 条高质量样本远胜 5000 条低质量样本。每条数据应经过人工审核
- 多样性:覆盖目标任务的各类场景和输入分布,避免数据偏斜导致模型偏向某种回答模式
- 去重:去除重复或高度相似的样本,防止模型过拟合
2026/5/29大约 3 分钟