从简单的聊天机器人到复杂的多智能体系统,LLM 应用的架构模式已形成相对成熟的分类。本页面梳理常见的架构模式及其适用场景。
单轮对话
最基本的模式:用户发送一条消息,LLM 返回一次回复。
- 适用场景:翻译、摘要、文本改写等无状态任务
- 架构要点:无需维护会话状态,每次请求独立处理
- 成本控制:输入 token 即输出 token,最简单直接的成本模型
多轮对话
2026/5/29大约 4 分钟
从简单的聊天机器人到复杂的多智能体系统,LLM 应用的架构模式已形成相对成熟的分类。本页面梳理常见的架构模式及其适用场景。
最基本的模式:用户发送一条消息,LLM 返回一次回复。