Agent 架构设计:从搭建者到设计师
不再直接打开平台写 Prompt,而是先拿起笔画信息流、控制流、状态管理——这就是从搭建者到设计师的转变。
Agent架构设计方法论
认知升级:搭建者 vs 设计师
| 维度 | 搭建者 (Builder) | 设计师 (Architect) |
|---|---|---|
| 关注点 | 功能实现 | 系统鲁棒性与可扩展性 |
| 思维方式 | 线性思维 | 模块化与概率思维(如果 A 失败了怎么办?) |
| 工具视角 | "平台有哪些组件可以用?" | "我需要什么样的认知结构?" |
| 典型问题 | "提示词怎么写效果好?" | "单 Agent 还是多 Agent?记忆该怎么存?" |
Agent 的设计核心:认知架构
不要只把 Agent 看作"Prompt + 工具",要把它设计成一个类脑系统:
用户输入 → 感知层 → 核心大脑 (LLM) → 行动层 → 工具集/输出
↕ ↕
记忆模块 规划模块
记忆设计
- 短期记忆:上下文窗口。设计要点:Token 预算管理、是否需要总结机制
- 长期记忆:RAG(向量数据库)。设计要点:什么信息值得存?检索策略?
- 状态记忆:工作流中流转的变量。设计要点:多轮对话中关键参数不丢失
规划设计
- 无规划:直接回答(Zero-shot)
- 任务拆解:先列计划再执行(Chain of Thought / Plan-and-Solve)
- 自我反思:执行后检查结果,不对则重试(Review & Refine)
四大主流架构模式
面对需求时,先思考用哪种模式。
模式 1:路由模式 (Router)
适用场景:用户意图分流、多功能入口。
一个"网关"Agent 不干活,只负责分类,把任务分发给专业的子 Agent 或工作流。路由节点的 Prompt 极度强调分类准确性,输出格式通常是结构化的 JSON。
模式 2:顺序工作流 (Workflow / SOP)
适用场景:标准化业务流程、辅助审批。
确定性的 DAG(有向无环图),Step 1 → Step 2 → Step 3。每个节点作为一个小 Agent,输入输出严格定义。容错性差,适合规则明确的场景。
模式 3:ReAct (Reasoning + Acting)
适用场景:复杂问题解决、需要反复调用工具。
"思考-行动-观察"的循环,Agent 自己决定下一步干什么,直到任务完成。极其灵活,但容易死循环、消耗 Token 多。需要设置最大循环次数。
模式 4:多智能体协作 (Multi-Agent)
适用场景:复杂项目、需要多角色配合。
- 分层式:一个总控 Agent 分解任务,指挥一群子 Agent
- 协作式:两个 Agent 互相对话(如 Writer + Critic 循环)
怎么判断自己"懂设计"了
接到需求时,不再直接打开平台写 Prompt,而是先画图:
- 信息流:数据怎么流转?
- 控制流:谁决定下一步做什么?(写死的 SOP 还是 Agent 自己决定?)
- 状态管理:走到这一步时,系统存了哪些变量?
学习路径
理论基石:
- Lilian Weng: LLM Powered Autonomous Agents(Agent 圣经)
- 论文概念:ReAct、Chain-of-Thought、Tree-of-Thoughts
框架研究:
- LangGraph:图导向架构,理解状态机和循环
- AutoGen:多 Agent 对话协作
实践练习:
- 把一个复杂流程画成状态机图
- 设计一个包含反思机制的 Agent:让它自己检查输出,不合格则重写