← 返回专栏

Agent 架构设计:从搭建者到设计师

不再直接打开平台写 Prompt,而是先拿起笔画信息流、控制流、状态管理——这就是从搭建者到设计师的转变。

Agent架构设计方法论

认知升级:搭建者 vs 设计师

维度搭建者 (Builder)设计师 (Architect)
关注点功能实现系统鲁棒性与可扩展性
思维方式线性思维模块化与概率思维(如果 A 失败了怎么办?)
工具视角"平台有哪些组件可以用?""我需要什么样的认知结构?"
典型问题"提示词怎么写效果好?""单 Agent 还是多 Agent?记忆该怎么存?"

Agent 的设计核心:认知架构

不要只把 Agent 看作"Prompt + 工具",要把它设计成一个类脑系统:

用户输入 → 感知层 → 核心大脑 (LLM) → 行动层 → 工具集/输出
                        ↕              ↕
                     记忆模块        规划模块

记忆设计

  • 短期记忆:上下文窗口。设计要点:Token 预算管理、是否需要总结机制
  • 长期记忆:RAG(向量数据库)。设计要点:什么信息值得存?检索策略?
  • 状态记忆:工作流中流转的变量。设计要点:多轮对话中关键参数不丢失

规划设计

  • 无规划:直接回答(Zero-shot)
  • 任务拆解:先列计划再执行(Chain of Thought / Plan-and-Solve)
  • 自我反思:执行后检查结果,不对则重试(Review & Refine)

四大主流架构模式

面对需求时,先思考用哪种模式。

模式 1:路由模式 (Router)

适用场景:用户意图分流、多功能入口。

一个"网关"Agent 不干活,只负责分类,把任务分发给专业的子 Agent 或工作流。路由节点的 Prompt 极度强调分类准确性,输出格式通常是结构化的 JSON。

模式 2:顺序工作流 (Workflow / SOP)

适用场景:标准化业务流程、辅助审批。

确定性的 DAG(有向无环图),Step 1 → Step 2 → Step 3。每个节点作为一个小 Agent,输入输出严格定义。容错性差,适合规则明确的场景。

模式 3:ReAct (Reasoning + Acting)

适用场景:复杂问题解决、需要反复调用工具。

"思考-行动-观察"的循环,Agent 自己决定下一步干什么,直到任务完成。极其灵活,但容易死循环、消耗 Token 多。需要设置最大循环次数。

模式 4:多智能体协作 (Multi-Agent)

适用场景:复杂项目、需要多角色配合。

  • 分层式:一个总控 Agent 分解任务,指挥一群子 Agent
  • 协作式:两个 Agent 互相对话(如 Writer + Critic 循环)

怎么判断自己"懂设计"了

接到需求时,不再直接打开平台写 Prompt,而是先画图:

  1. 信息流:数据怎么流转?
  2. 控制流:谁决定下一步做什么?(写死的 SOP 还是 Agent 自己决定?)
  3. 状态管理:走到这一步时,系统存了哪些变量?

学习路径

理论基石:

  • Lilian Weng: LLM Powered Autonomous Agents(Agent 圣经)
  • 论文概念:ReAct、Chain-of-Thought、Tree-of-Thoughts

框架研究:

  • LangGraph:图导向架构,理解状态机和循环
  • AutoGen:多 Agent 对话协作

实践练习:

  • 把一个复杂流程画成状态机图
  • 设计一个包含反思机制的 Agent:让它自己检查输出,不合格则重写