Skip to Content

09e - Agent 架构模板

本文是《AI Agent 实战手册》第 9 章第 5 节。 上一节:09d-Agent记忆系统 | 下一节:09f-架构选择决策框架

概述

架构模板是经过验证的 Agent 系统蓝图,为不同应用场景提供可复用的组件组合、技术栈选型和系统提示词模板。2025-2026 年,随着 LangGraph、CrewAI 等框架的成熟和 Claude Code、Cursor 等编码助手的普及,Agent 架构已从实验阶段进入生产落地阶段。本节提供 5 种核心 Agent 类型的完整架构模板——Chatbot Agent、编码助手 Agent、研究 Agent、工作流 Agent 和自主任务 Agent——每种模板均包含架构图、组件清单、推荐技术栈、系统提示词模板和扩展考量。


1. Chatbot Agent——对话式 AI

1.1 架构概览

Chatbot Agent 是最基础也最常见的 Agent 类型,核心能力是多轮对话、记忆管理和工具调用。现代 Chatbot 已远超传统问答机器人,具备个性化适应、上下文感知和主动工具使用能力。

1.2 组件清单与职责

组件职责关键指标
API Gateway请求认证、限流、负载均衡P99 延迟 < 50ms
意图路由分类用户意图,分发到对应处理链准确率 > 95%
对话引擎管理多轮对话状态和上下文上下文保持 > 20 轮
工具调度器解析工具调用请求,执行并返回结果工具调用成功率 > 99%
RAG 检索从知识库检索相关文档片段召回率 > 85%
LLM 推理核心推理和生成首 token 延迟 < 500ms
记忆管理器管理短期/长期记忆的读写检索延迟 < 100ms
Guardrails输入/输出安全过滤拦截率 > 99.5%

1.3 推荐技术栈

工具用途价格适用场景
Claude 3.5 Sonnet / Claude 4主推理模型$3/$15 per 1M tokens (input/output)高质量对话、复杂推理
GPT-4o主推理模型(替代)$2.5/$10 per 1M tokens多模态对话、快速响应
GPT-4o-mini意图路由/简单对话$0.15/$0.60 per 1M tokens低成本路由和简单任务
Mem0记忆管理开源免费 / 云版 $49/月起跨会话个性化记忆
Qdrant向量数据库开源免费 / 云版 $25/月起长期记忆和 RAG 检索
LangGraphAgent 编排开源免费复杂对话流程编排
Guardrails AI输出验证开源免费结构化输出和安全过滤
Redis会话缓存开源免费 / 云版 $5/月起短期记忆和会话状态

1.4 系统提示词模板

你是 [产品名称] 的 AI 助手,专注于 [领域描述]。 ## 角色定义 - 身份:[具体角色,如"专业客服顾问"] - 语气:[友好/专业/简洁] - 语言:[中文/英文/多语言] ## 核心能力 1. 回答关于 [领域] 的问题 2. 使用以下工具辅助用户: - search_knowledge_base: 搜索知识库获取准确信息 - create_ticket: 创建工单转人工处理 - check_order_status: 查询订单状态 3. 记住用户偏好和历史交互 ## 行为规则 - 不确定时,使用 search_knowledge_base 工具查询,不要编造信息 - 超出能力范围时,使用 create_ticket 转人工 - 每次回复控制在 [200] 字以内,除非用户要求详细解释 - 涉及敏感信息(支付、密码)时,引导用户通过安全渠道处理 ## 记忆指令 - 记住用户的姓名、偏好和常见问题 - 引用之前的对话内容保持连贯性

1.5 关键配置参数

chatbot_config: model: "claude-sonnet-4-20250514" temperature: 0.7 # 对话自然度 max_tokens: 1024 # 单次回复上限 context_window: 20 # 保留最近 N 轮对话 memory: short_term: "redis" # 会话级缓存 long_term: "qdrant" # 跨会话记忆 summarize_after: 10 # 超过 N 轮后压缩历史 guardrails: max_input_length: 2000 blocked_topics: ["政治", "暴力", "色情"] pii_detection: true tools: max_tool_calls: 5 # 单次最多工具调用次数 timeout: 10s # 工具调用超时

1.6 扩展考量

  • 水平扩展:无状态设计 + Redis 会话存储,支持多实例部署
  • 成本优化:简单意图用小模型路由(GPT-4o-mini),复杂问题用大模型
  • 多语言:使用语言检测自动切换提示词模板
  • 监控:接入 LangSmith/Langfuse 追踪每次对话的 token 消耗和延迟

2. 编码助手 Agent

2.1 架构概览

编码助手 Agent 是 2025-2026 年发展最快的 Agent 类型,以 Claude Code、Cursor、GitHub Copilot 为代表。其核心架构围绕”理解代码库→规划修改→执行变更→验证结果”的 Agentic Loop 展开,具备文件系统操作、命令执行、代码分析等能力。

2.2 组件清单与职责

组件职责关键指标
指令解析器理解开发者的自然语言意图意图识别准确率 > 90%
任务规划器将复杂任务分解为可执行的子步骤Plan Mode 规划质量
代码阅读器解析项目结构、AST、依赖关系支持 20+ 语言
上下文构建器组装相关文件、规则、历史到上下文窗口上下文利用率 > 80%
LLM 推理引擎代码生成、Bug 修复、重构推理首次通过率 > 70%
文件系统读写项目文件操作延迟 < 10ms
代码编辑器AST 级别的精确代码修改编辑成功率 > 95%
Shell 执行器运行测试、构建、lint 等命令命令超时保护
代码搜索语义搜索和正则搜索代码库搜索延迟 < 200ms
验证器运行测试、类型检查、lint 验证修改自动修复率 > 60%

2.3 推荐技术栈

工具用途价格适用场景
Claude CodeCLI 编码助手Max 订阅 $100/月 或 API 按量终端原生、自主编码
CursorIDE 集成编码助手Pro $20/月IDE 内编码、多文件编辑
GitHub CopilotIDE 补全 + AgentIndividual $10/月代码补全、PR 审查
Claude Sonnet 4编码推理模型$3/$15 per 1M tokens复杂代码生成和重构
Claude Opus 4深度推理模型$15/$75 per 1M tokens架构设计、复杂 Bug 修复
tree-sitterAST 解析开源免费多语言代码结构分析
ripgrep代码搜索开源免费快速全文搜索
KiroSpec-Driven IDE免费预览版需求→设计→任务驱动开发

2.4 系统提示词模板

你是一个高级编码助手,在 [项目名称] 项目中工作。 ## 项目上下文 - 技术栈:[TypeScript/React/Node.js] - 包管理器:[pnpm] - 测试框架:[Vitest] - 代码风格:[ESLint + Prettier] ## 工作流程 1. 收到任务后,先阅读相关文件理解现有代码 2. 制定修改计划,列出需要修改的文件和原因 3. 逐步执行修改,每次修改后运行相关测试 4. 如果测试失败,分析原因并修复 5. 所有测试通过后,总结所做的修改 ## 编码规则 - 遵循项目现有的代码风格和命名约定 - 新增功能必须包含单元测试 - 不修改不相关的文件 - 使用 TypeScript 严格模式,不使用 any 类型 - 优先使用项目已有的工具库,避免引入新依赖 ## 工具使用 - 使用 readCode 理解代码结构 - 使用 editCode 进行 AST 级别的精确修改 - 使用 executeBash 运行测试和构建命令 - 使用 grepSearch 搜索代码库中的模式 ## 安全边界 - 不执行 rm -rf 或其他危险命令 - 不修改 .env 文件中的密钥 - 不提交包含敏感信息的代码

2.5 关键配置参数

coding_assistant_config: model: "claude-sonnet-4-20250514" thinking_model: "claude-opus-4-20250514" # 复杂任务用 temperature: 0.0 # 代码生成需要确定性 max_tokens: 16384 # 支持大段代码生成 context: max_files: 50 # 单次上下文最多文件数 max_context_tokens: 100000 rule_files: ["CLAUDE.md", ".cursorrules"] execution: shell_timeout: 120s # 命令执行超时 max_retries: 3 # 测试失败最大重试次数 sandbox: true # 沙箱模式 verification: run_tests: true run_lint: true run_typecheck: true auto_fix: true # 自动修复 lint 错误

2.6 扩展考量

  • Subagent 模式:复杂任务拆分为多个 Subagent 并行执行(如一个写代码、一个写测试)
  • 上下文管理:大型代码库使用 RAG + AST 索引,避免上下文溢出
  • 成本控制:简单补全用小模型,复杂重构用大模型,通过路由降低成本
  • 安全沙箱:使用 Docker/gVisor 隔离命令执行环境

3. 研究 Agent

3.1 架构概览

研究 Agent 是 Deep Research 类产品(如 Perplexity Deep Research、ChatGPT Deep Research、GPT Researcher)的核心架构。其特点是自主规划研究路径、并行信息采集、多源交叉验证和结构化报告生成。典型架构采用”规划者-执行者-发布者”三层模式。

3.2 组件清单与职责

组件职责关键指标
研究规划器分解研究问题为子问题,制定研究策略子问题覆盖率 > 90%
研究执行器针对单个子问题执行信息采集并行执行 3-10 个
Web 搜索搜索互联网获取最新信息搜索结果相关性 > 80%
文档解析解析 PDF、网页、论文等文档支持 10+ 格式
API 数据调用结构化数据 API数据准确率 100%
信息聚合器合并去重多源信息去重率 > 95%
交叉验证器多源信息一致性校验矛盾检测率 > 85%
报告生成器生成结构化研究报告引用准确率 > 95%
质量审查评估报告完整性,决定是否需要补充研究一次通过率 > 70%

3.3 推荐技术栈

工具用途价格适用场景
Claude Opus 4研究规划和报告生成$15/$75 per 1M tokens深度推理和长文生成
Claude Sonnet 4研究执行和信息提取$3/$15 per 1M tokens并行子任务执行
Tavily Search APIWeb 搜索免费 1000 次/月 / $50/月起AI 优化的搜索结果
Firecrawl网页抓取和解析免费 500 页/月 / $19/月起结构化网页内容提取
GPT Researcher开源研究框架开源免费(需 API 费用)自动化深度研究
LangGraph研究流程编排开源免费状态机驱动的研究流程
Jina Reader网页转 Markdown免费网页内容清洗
Pandoc文档格式转换开源免费PDF/DOCX 报告导出

3.4 系统提示词模板

你是一个专业研究分析师,负责对 [研究主题] 进行深度调研。 ## 研究方法论 1. **问题分解**:将研究问题拆分为 3-7 个可独立调查的子问题 2. **多源采集**:每个子问题至少查询 3 个不同来源 3. **交叉验证**:关键数据点必须有 2+ 个独立来源确认 4. **时效性优先**:优先使用最近 6 个月内的信息来源 ## 输出格式 研究报告必须包含: - 执行摘要(200 字以内) - 关键发现(带编号的要点列表) - 详细分析(按子问题组织) - 数据表格(对比分析时使用) - 局限性说明(研究的不足和偏差) - 参考来源(带 URL 和访问日期) ## 质量标准 - 每个事实性陈述必须标注来源 - 区分"已确认事实"和"推测/观点" - 发现矛盾信息时,列出所有观点并分析可能原因 - 明确标注信息的时效性(截止日期) ## 工具使用 - search: 搜索互联网获取信息 - read_url: 深度阅读特定网页 - analyze_document: 解析上传的文档 - create_chart: 生成数据可视化图表

3.5 关键配置参数

research_agent_config: planner_model: "claude-opus-4-20250514" executor_model: "claude-sonnet-4-20250514" writer_model: "claude-opus-4-20250514" max_sub_questions: 7 max_sources_per_question: 10 parallel_executors: 5 # 并行研究执行器数量 search: provider: "tavily" max_results: 10 include_domains: [] # 限定搜索域名 exclude_domains: [] verification: min_sources: 2 # 关键数据最少来源数 cross_check: true # 启用交叉验证 output: format: "markdown" # markdown / pdf / docx max_length: 5000 # 报告最大字数 include_citations: true timeout: per_question: 120s # 单个子问题超时 total: 600s # 总研究超时

3.6 扩展考量

  • 增量研究:支持在已有报告基础上追加新信息,避免重复搜索
  • 领域专精:通过 RAG 注入领域知识库,提升专业领域研究质量
  • 多模态:支持图表分析、视频内容提取等多模态信息源
  • 协作模式:多个研究 Agent 分工协作,一个负责技术调研,一个负责市场分析

4. 工作流 Agent

4.1 架构概览

工作流 Agent 专注于多步骤业务流程自动化,核心特点是状态机驱动、条件分支、错误恢复和人工审批节点。与简单的自动化脚本不同,工作流 Agent 在每个节点都具备 LLM 推理能力,能处理非结构化输入和异常情况。典型应用包括客户入职、内容审核管线、数据处理流水线等。

4.2 组件清单与职责

组件职责关键指标
触发器Webhook/定时/事件驱动启动工作流触发延迟 < 1s
状态管理器维护工作流当前状态和历史状态持久化、崩溃恢复
步骤执行器执行单个工作流步骤(含 LLM 推理)步骤成功率 > 99%
条件路由基于数据和 AI 判断选择分支路由准确率 > 95%
人工审批节点暂停工作流等待人工决策通知延迟 < 5s
错误处理器重试、降级、告警自动恢复率 > 80%
检查点管理保存中间状态,支持断点续执行恢复成功率 100%
审计日志记录每步操作和决策依据日志完整性 100%

4.3 推荐技术栈

工具用途价格适用场景
n8n低代码工作流编排开源免费 / 云版 €20/月起可视化工作流、422+ 集成
LangGraph代码级工作流编排开源免费复杂状态机、自定义逻辑
Temporal持久化工作流引擎开源免费 / 云版按量计费高可靠性、长时间运行
Make.com低代码自动化免费 / $9/月起简单自动化、快速搭建
Claude Sonnet 4步骤内 AI 推理$3/$15 per 1M tokens非结构化数据处理
PostgreSQL状态存储开源免费工作流状态和审计日志
Redis任务队列开源免费步骤间消息传递
Slack/飞书 API人工审批通知免费审批通知和交互

4.4 系统提示词模板

你是一个工作流自动化 Agent,负责执行 [业务流程名称] 流程。 ## 当前步骤 步骤名称:[step_name] 步骤描述:[step_description] 输入数据:[input_data] ## 执行指令 1. 分析输入数据,提取关键信息 2. 根据以下业务规则做出决策: - 规则 1:[如果金额 > 10000,需要人工审批] - 规则 2:[如果客户等级为 VIP,走快速通道] - 规则 3:[如果数据不完整,返回错误并说明缺失字段] 3. 生成结构化输出 ## 输出格式 必须返回 JSON 格式: { "decision": "approve | reject | escalate | retry", "reason": "决策原因说明", "next_step": "下一步骤名称", "output_data": { ... }, "confidence": 0.0-1.0 } ## 安全规则 - confidence < 0.7 时,必须 escalate 到人工审批 - 不修改原始输入数据 - 所有决策必须记录 reason

4.5 关键配置参数

workflow_agent_config: model: "claude-sonnet-4-20250514" temperature: 0.0 # 业务决策需要确定性 max_tokens: 2048 workflow: max_steps: 20 # 最大步骤数 step_timeout: 60s # 单步超时 total_timeout: 3600s # 工作流总超时 checkpoint_interval: 1 # 每 N 步保存检查点 retry: max_retries: 3 backoff: "exponential" # 指数退避 initial_delay: 5s human_in_loop: enabled: true approval_timeout: 86400s # 人工审批超时(24h) notification_channels: ["slack", "email"] escalation_threshold: 0.7 # 置信度阈值 error_handling: dead_letter_queue: true # 死信队列 alert_on_failure: true fallback_path: "manual" # 降级到人工处理

4.6 扩展考量

  • 持久化执行:使用 Temporal/Durable Functions 确保长时间运行的工作流不丢失状态
  • 版本管理:工作流定义版本化,支持灰度发布和回滚
  • 并行分支:支持 fan-out/fan-in 模式并行执行多个子流程
  • 监控仪表板:实时展示工作流执行状态、瓶颈步骤和错误率

5. 自主任务 Agent

5.1 架构概览

自主任务 Agent 是最复杂的 Agent 类型,具备目标分解、自主规划、工具选择、自我反思和迭代优化能力。与工作流 Agent 的预定义流程不同,自主任务 Agent 的执行路径是动态生成的。代表性系统包括 AutoGPT、BabyAGI、Devin 等。其核心架构采用 Plan-Act-Observe-Reflect 循环。

5.2 组件清单与职责

组件职责关键指标
目标解析器将高层目标转化为可衡量的成功标准目标明确度评分
规划器动态生成和调整任务执行计划计划可行性 > 80%
任务队列管理待执行任务的优先级和依赖关系任务调度延迟 < 100ms
执行器选择工具并执行具体操作单步成功率 > 85%
工具选择器根据任务类型选择最优工具工具匹配准确率 > 90%
观察器收集执行结果和环境反馈结果解析准确率 > 95%
反思器评估进展、识别问题、调整策略问题识别率 > 80%
工作记忆维护当前任务的中间状态状态一致性 100%
长期记忆存储知识和经验供未来任务使用检索相关性 > 85%
经验记忆记录成功/失败模式用于策略优化经验复用率 > 60%

5.3 推荐技术栈

工具用途价格适用场景
Claude Opus 4规划和反思推理$15/$75 per 1M tokens复杂目标分解和策略调整
Claude Sonnet 4任务执行$3/$15 per 1M tokens具体步骤执行
LangGraphAgent 循环编排开源免费状态机驱动的 Agent 循环
CrewAI多角色协作开源免费 / 企业版按需角色分工的自主任务
Playwright/Puppeteer浏览器自动化开源免费Web 交互和数据采集
E2B代码沙箱免费 100 小时/月 / $0.10/小时安全的代码执行环境
Mem0记忆管理开源免费 / 云版 $49/月起跨任务经验记忆
Qdrant向量存储开源免费 / 云版 $25/月起长期知识存储

5.4 系统提示词模板

你是一个自主任务执行 Agent,能够独立完成复杂的多步骤目标。 ## 目标 [用户提供的高层目标] ## 执行框架:Plan-Act-Observe-Reflect ### Plan(规划) - 将目标分解为 3-10 个可执行的子任务 - 为每个子任务定义成功标准和预期输出 - 识别任务间的依赖关系,确定执行顺序 - 估算每个子任务的复杂度和所需工具 ### Act(执行) - 按优先级执行任务队列中的下一个任务 - 选择最合适的工具完成当前任务 - 每次只执行一个原子操作,观察结果后再继续 ### Observe(观察) - 检查执行结果是否符合预期 - 收集环境反馈和错误信息 - 更新工作记忆中的任务状态 ### Reflect(反思) - 评估当前进展与目标的距离 - 如果当前方法不奏效,分析原因并调整策略 - 如果发现新信息,更新计划 - 如果连续 3 次失败,降级到更简单的方法或请求人工帮助 ## 可用工具 - execute_code: 在沙箱中执行 Python/JavaScript 代码 - web_search: 搜索互联网 - browse_url: 访问和解析网页 - read_file / write_file: 文件读写 - shell_command: 执行 shell 命令(受限) - ask_human: 遇到无法解决的问题时请求人工帮助 ## 安全边界 - 每次执行前评估操作的风险等级(低/中/高) - 高风险操作(删除文件、发送邮件、API 写操作)需要确认 - 总预算限制:最多 [100] 次 LLM 调用,[50] 次工具调用 - 如果预算即将耗尽,总结当前进展并报告

5.5 关键配置参数

autonomous_agent_config: planner_model: "claude-opus-4-20250514" executor_model: "claude-sonnet-4-20250514" reflector_model: "claude-opus-4-20250514" temperature: planning: 0.3 # 规划需要一定创造性 execution: 0.0 # 执行需要确定性 reflection: 0.2 # 反思需要分析能力 budget: max_llm_calls: 100 # LLM 调用上限 max_tool_calls: 50 # 工具调用上限 max_cost: 10.0 # 美元成本上限 max_duration: 3600s # 总时间上限 planning: max_subtasks: 10 replan_threshold: 3 # 连续失败 N 次后重新规划 max_replans: 3 # 最大重新规划次数 execution: sandbox: "e2b" # 代码执行沙箱 tool_timeout: 60s max_retries: 2 safety: risk_assessment: true # 操作前风险评估 high_risk_confirmation: true blocked_operations: ["rm -rf", "DROP TABLE", "format"] memory: working_memory_size: 20 # 工作记忆条目数 long_term_store: "qdrant" experience_replay: true # 启用经验回放

5.6 扩展考量

  • 人机协作:关键决策点设置 Human-in-the-Loop 检查点,平衡自主性和安全性
  • 预算管理:实时追踪 token 消耗和 API 调用次数,接近上限时自动降级
  • 经验学习:将成功的执行路径存入经验记忆,类似任务可直接复用
  • 多 Agent 协作:复杂目标拆分给多个专业 Agent(如一个负责编码、一个负责测试、一个负责部署)

6. 五大模板对比总览

6.1 综合对比表

维度Chatbot Agent编码助手 Agent研究 Agent工作流 Agent自主任务 Agent
复杂度⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
自主性中-高低-中
核心循环对话循环Agentic Loop规划-采集-综合状态机Plan-Act-Observe-Reflect
典型工具数3-55-103-75-205-15
记忆需求短期+长期项目上下文研究上下文工作流状态全类型记忆
人工介入每轮对话审查修改审查报告审批节点关键决策点
延迟要求< 2s< 30s/步分钟级秒-分钟级分钟-小时级
成本/次$0.01-0.05$0.10-2.00$0.50-5.00$0.05-0.50$1.00-10.00
推荐框架LangChainClaude Code/CursorGPT Researchern8n/LangGraphLangGraph/CrewAI
生产就绪度⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐

6.2 模板选择指南

根据你的使用场景,选择最合适的架构模板:

选择建议速查

如果你需要…选择原因
客服机器人、FAQ 问答Chatbot Agent成熟稳定,成本最低
AI 辅助写代码、修 Bug编码助手 Agent专为代码场景优化
市场调研、竞品分析研究 Agent多源采集和交叉验证
订单处理、内容审核管线工作流 Agent状态机保证流程可靠性
”帮我完成 X”的开放式任务自主任务 Agent动态规划和自我修正
简单 API 调用自动化不需要 Agent传统脚本更高效

实战案例:从零搭建客服 + 工单升级 Agent

以下案例展示如何组合 Chatbot Agent 和工作流 Agent 模板,构建一个具备自动回答、工单创建和人工升级能力的客服系统。

场景描述

一个 SaaS 产品的客服系统,需要:

  1. 自动回答常见问题(基于知识库)
  2. 无法回答时创建工单并通知人工客服
  3. VIP 客户自动走快速通道

架构组合

核心代码示例(LangGraph + Python)

from langgraph.graph import StateGraph, END from typing import TypedDict, Literal class CustomerState(TypedDict): query: str customer_id: str is_vip: bool kb_answer: str | None confidence: float ticket_id: str | None def search_knowledge_base(state: CustomerState) -> CustomerState: """搜索知识库回答客户问题""" # RAG 检索逻辑 answer, confidence = rag_search(state["query"]) return {**state, "kb_answer": answer, "confidence": confidence} def route_by_confidence(state: CustomerState) -> Literal["respond", "create_ticket"]: """根据置信度决定自动回复还是创建工单""" if state["confidence"] > 0.8: return "respond" return "create_ticket" def auto_respond(state: CustomerState) -> CustomerState: """自动回复客户""" send_message(state["customer_id"], state["kb_answer"]) return state def create_ticket(state: CustomerState) -> CustomerState: """创建工单并路由""" priority = "high" if state["is_vip"] else "normal" ticket = create_support_ticket( query=state["query"], customer_id=state["customer_id"], priority=priority ) return {**state, "ticket_id": ticket.id} # 构建工作流图 graph = StateGraph(CustomerState) graph.add_node("search_kb", search_knowledge_base) graph.add_node("respond", auto_respond) graph.add_node("create_ticket", create_ticket) graph.set_entry_point("search_kb") graph.add_conditional_edges("search_kb", route_by_confidence) graph.add_edge("respond", END) graph.add_edge("create_ticket", END) app = graph.compile()

案例分析

  • 模板组合:Chatbot 模板处理对话层,工作流模板处理升级流程,两者通过置信度阈值衔接
  • 关键决策点:置信度 0.8 是自动回复和人工升级的分界线,需要根据实际数据调优
  • 成本优化:80% 的常见问题由 Chatbot 自动回答(成本 ~$0.02/次),仅 20% 需要人工介入
  • 可观测性:每次交互记录置信度、响应时间、是否升级,用于持续优化知识库

避坑指南

❌ 常见错误

  1. 过度设计:简单任务用了自主 Agent 架构

    • 问题:一个 FAQ 机器人不需要 Plan-Act-Observe-Reflect 循环,过度设计导致延迟高、成本高、调试困难
    • 正确做法:从最简单的 Chatbot 模板开始,只在确实需要时才升级到更复杂的架构
  2. 忽略记忆管理导致上下文丢失

    • 问题:Chatbot 没有实现记忆压缩,长对话后上下文窗口溢出,Agent “失忆”
    • 正确做法:设置对话轮数阈值(如 10 轮),超过后自动压缩历史为摘要
  3. 编码助手没有验证环节

    • 问题:Agent 生成代码后直接提交,没有运行测试和 lint 检查,引入 Bug
    • 正确做法:每次代码修改后必须运行验证器(测试 + 类型检查 + lint),失败则自动修复
  4. 研究 Agent 没有交叉验证

    • 问题:只从单一来源获取信息,容易被错误信息误导,生成不准确的报告
    • 正确做法:关键数据点要求至少 2 个独立来源确认,发现矛盾时标注并分析
  5. 工作流 Agent 没有错误恢复机制

    • 问题:某个步骤失败后整个工作流崩溃,需要从头重新执行
    • 正确做法:每步保存检查点,失败时从最近的检查点恢复,配合指数退避重试
  6. 自主 Agent 没有预算限制

    • 问题:Agent 陷入无限循环,不断调用 LLM 和工具,产生巨额费用
    • 正确做法:设置 LLM 调用次数、工具调用次数和美元成本的硬上限
  7. 所有步骤都用最贵的模型

    • 问题:意图路由、简单分类等任务也用 Claude Opus,成本是必要的 50 倍
    • 正确做法:按任务复杂度路由模型——简单任务用 mini 模型,复杂推理用大模型

✅ 最佳实践

  1. 从简单开始,按需升级:先用 Chatbot 模板验证需求,再逐步添加工具、记忆、工作流等能力
  2. 模板可组合:不同模板可以组合使用(如 Chatbot + 工作流),不必局限于单一模板
  3. 可观测性优先:从第一天就接入 LangSmith/Langfuse,追踪每次交互的成本、延迟和质量
  4. 安全边界明确:每个模板都必须配置 Guardrails,特别是自主 Agent 必须有预算和权限限制
  5. 渐进式自主:从人工审批每步操作开始,随着信任度提升逐步放宽自主权限

相关资源与延伸阅读

  1. LangGraph 官方文档 — Agent 架构指南  — LangGraph 状态机编排的完整教程和示例
  2. Anthropic — Building Effective Agents  — Anthropic 官方的 Agent 构建最佳实践
  3. OpenAI Cookbook — Agent 设计模式  — OpenAI 提供的 Agent 实现示例集
  4. GPT Researcher — 开源研究 Agent  — 研究 Agent 架构的参考实现
  5. CrewAI 文档 — 多角色 Agent 框架  — 角色制 Agent 协作框架
  6. n8n AI Agent 节点文档  — 低代码工作流 Agent 配置指南
  7. Mem0 — Agent 记忆层  — 开源 Agent 记忆管理框架
  8. E2B — AI 代码沙箱  — 安全的 Agent 代码执行环境

参考来源


📖 返回 总览与导航 | 上一节:09d-Agent记忆系统 | 下一节:09f-架构选择决策框架

Last updated on