09e - Agent 架构模板

本文是《AI Agent 实战手册》第 9 章第 5 节。上一节：09d-Agent记忆系统 | 下一节：09f-架构选择决策框架

概述

架构模板是经过验证的 Agent 系统蓝图，为不同应用场景提供可复用的组件组合、技术栈选型和系统提示词模板。2025-2026 年，随着 LangGraph、CrewAI 等框架的成熟和 Claude Code、Cursor 等编码助手的普及，Agent 架构已从实验阶段进入生产落地阶段。本节提供 5 种核心 Agent 类型的完整架构模板——Chatbot Agent、编码助手 Agent、研究 Agent、工作流 Agent 和自主任务 Agent——每种模板均包含架构图、组件清单、推荐技术栈、系统提示词模板和扩展考量。

1. Chatbot Agent——对话式 AI

1.1 架构概览

Chatbot Agent 是最基础也最常见的 Agent 类型，核心能力是多轮对话、记忆管理和工具调用。现代 Chatbot 已远超传统问答机器人，具备个性化适应、上下文感知和主动工具使用能力。

1.2 组件清单与职责

组件	职责	关键指标
API Gateway	请求认证、限流、负载均衡	P99 延迟 < 50ms
意图路由	分类用户意图，分发到对应处理链	准确率 > 95%
对话引擎	管理多轮对话状态和上下文	上下文保持 > 20 轮
工具调度器	解析工具调用请求，执行并返回结果	工具调用成功率 > 99%
RAG 检索	从知识库检索相关文档片段	召回率 > 85%
LLM 推理	核心推理和生成	首 token 延迟 < 500ms
记忆管理器	管理短期/长期记忆的读写	检索延迟 < 100ms
Guardrails	输入/输出安全过滤	拦截率 > 99.5%

1.3 推荐技术栈

工具	用途	价格	适用场景
Claude 3.5 Sonnet / Claude 4	主推理模型	$3/$15 per 1M tokens (input/output)	高质量对话、复杂推理
GPT-4o	主推理模型（替代）	$2.5/$10 per 1M tokens	多模态对话、快速响应
GPT-4o-mini	意图路由/简单对话	$0.15/$0.60 per 1M tokens	低成本路由和简单任务
Mem0	记忆管理	开源免费 / 云版 $49/月起	跨会话个性化记忆
Qdrant	向量数据库	开源免费 / 云版 $25/月起	长期记忆和 RAG 检索
LangGraph	Agent 编排	开源免费	复杂对话流程编排
Guardrails AI	输出验证	开源免费	结构化输出和安全过滤
Redis	会话缓存	开源免费 / 云版 $5/月起	短期记忆和会话状态

1.4 系统提示词模板


你是 [产品名称] 的 AI 助手，专注于 [领域描述]。

## 角色定义
- 身份：[具体角色，如"专业客服顾问"]
- 语气：[友好/专业/简洁]
- 语言：[中文/英文/多语言]

## 核心能力
1. 回答关于 [领域] 的问题
2. 使用以下工具辅助用户：
   - search_knowledge_base: 搜索知识库获取准确信息
   - create_ticket: 创建工单转人工处理
   - check_order_status: 查询订单状态
3. 记住用户偏好和历史交互

## 行为规则
- 不确定时，使用 search_knowledge_base 工具查询，不要编造信息
- 超出能力范围时，使用 create_ticket 转人工
- 每次回复控制在 [200] 字以内，除非用户要求详细解释
- 涉及敏感信息（支付、密码）时，引导用户通过安全渠道处理

## 记忆指令
- 记住用户的姓名、偏好和常见问题
- 引用之前的对话内容保持连贯性

1.5 关键配置参数


chatbot_config:
  model: "claude-sonnet-4-20250514"
  temperature: 0.7          # 对话自然度
  max_tokens: 1024           # 单次回复上限
  context_window: 20         # 保留最近 N 轮对话
  memory:
    short_term: "redis"      # 会话级缓存
    long_term: "qdrant"      # 跨会话记忆
    summarize_after: 10      # 超过 N 轮后压缩历史
  guardrails:
    max_input_length: 2000
    blocked_topics: ["政治", "暴力", "色情"]
    pii_detection: true
  tools:
    max_tool_calls: 5        # 单次最多工具调用次数
    timeout: 10s             # 工具调用超时

1.6 扩展考量

水平扩展：无状态设计 + Redis 会话存储，支持多实例部署
成本优化：简单意图用小模型路由（GPT-4o-mini），复杂问题用大模型
多语言：使用语言检测自动切换提示词模板
监控：接入 LangSmith/Langfuse 追踪每次对话的 token 消耗和延迟

2. 编码助手 Agent

2.1 架构概览

编码助手 Agent 是 2025-2026 年发展最快的 Agent 类型，以 Claude Code、Cursor、GitHub Copilot 为代表。其核心架构围绕”理解代码库→规划修改→执行变更→验证结果”的 Agentic Loop 展开，具备文件系统操作、命令执行、代码分析等能力。

2.2 组件清单与职责

组件	职责	关键指标
指令解析器	理解开发者的自然语言意图	意图识别准确率 > 90%
任务规划器	将复杂任务分解为可执行的子步骤	Plan Mode 规划质量
代码阅读器	解析项目结构、AST、依赖关系	支持 20+ 语言
上下文构建器	组装相关文件、规则、历史到上下文窗口	上下文利用率 > 80%
LLM 推理引擎	代码生成、Bug 修复、重构推理	首次通过率 > 70%
文件系统	读写项目文件	操作延迟 < 10ms
代码编辑器	AST 级别的精确代码修改	编辑成功率 > 95%
Shell 执行器	运行测试、构建、lint 等命令	命令超时保护
代码搜索	语义搜索和正则搜索代码库	搜索延迟 < 200ms
验证器	运行测试、类型检查、lint 验证修改	自动修复率 > 60%

2.3 推荐技术栈

工具	用途	价格	适用场景
Claude Code	CLI 编码助手	Max 订阅 $100/月或 API 按量	终端原生、自主编码
Cursor	IDE 集成编码助手	Pro $20/月	IDE 内编码、多文件编辑
GitHub Copilot	IDE 补全 + Agent	Individual $10/月	代码补全、PR 审查
Claude Sonnet 4	编码推理模型	$3/$15 per 1M tokens	复杂代码生成和重构
Claude Opus 4	深度推理模型	$15/$75 per 1M tokens	架构设计、复杂 Bug 修复
tree-sitter	AST 解析	开源免费	多语言代码结构分析
ripgrep	代码搜索	开源免费	快速全文搜索
Kiro	Spec-Driven IDE	免费预览版	需求→设计→任务驱动开发

2.4 系统提示词模板


你是一个高级编码助手，在 [项目名称] 项目中工作。

## 项目上下文
- 技术栈：[TypeScript/React/Node.js]
- 包管理器：[pnpm]
- 测试框架：[Vitest]
- 代码风格：[ESLint + Prettier]

## 工作流程
1. 收到任务后，先阅读相关文件理解现有代码
2. 制定修改计划，列出需要修改的文件和原因
3. 逐步执行修改，每次修改后运行相关测试
4. 如果测试失败，分析原因并修复
5. 所有测试通过后，总结所做的修改

## 编码规则
- 遵循项目现有的代码风格和命名约定
- 新增功能必须包含单元测试
- 不修改不相关的文件
- 使用 TypeScript 严格模式，不使用 any 类型
- 优先使用项目已有的工具库，避免引入新依赖

## 工具使用
- 使用 readCode 理解代码结构
- 使用 editCode 进行 AST 级别的精确修改
- 使用 executeBash 运行测试和构建命令
- 使用 grepSearch 搜索代码库中的模式

## 安全边界
- 不执行 rm -rf 或其他危险命令
- 不修改 .env 文件中的密钥
- 不提交包含敏感信息的代码

2.5 关键配置参数


coding_assistant_config:
  model: "claude-sonnet-4-20250514"
  thinking_model: "claude-opus-4-20250514"  # 复杂任务用
  temperature: 0.0           # 代码生成需要确定性
  max_tokens: 16384          # 支持大段代码生成
  context:
    max_files: 50            # 单次上下文最多文件数
    max_context_tokens: 100000
    rule_files: ["CLAUDE.md", ".cursorrules"]
  execution:
    shell_timeout: 120s      # 命令执行超时
    max_retries: 3           # 测试失败最大重试次数
    sandbox: true            # 沙箱模式
  verification:
    run_tests: true
    run_lint: true
    run_typecheck: true
    auto_fix: true           # 自动修复 lint 错误

2.6 扩展考量

Subagent 模式：复杂任务拆分为多个 Subagent 并行执行（如一个写代码、一个写测试）
上下文管理：大型代码库使用 RAG + AST 索引，避免上下文溢出
成本控制：简单补全用小模型，复杂重构用大模型，通过路由降低成本
安全沙箱：使用 Docker/gVisor 隔离命令执行环境

3. 研究 Agent

3.1 架构概览

研究 Agent 是 Deep Research 类产品（如 Perplexity Deep Research、ChatGPT Deep Research、GPT Researcher）的核心架构。其特点是自主规划研究路径、并行信息采集、多源交叉验证和结构化报告生成。典型架构采用”规划者-执行者-发布者”三层模式。

3.2 组件清单与职责

组件	职责	关键指标
研究规划器	分解研究问题为子问题，制定研究策略	子问题覆盖率 > 90%
研究执行器	针对单个子问题执行信息采集	并行执行 3-10 个
Web 搜索	搜索互联网获取最新信息	搜索结果相关性 > 80%
文档解析	解析 PDF、网页、论文等文档	支持 10+ 格式
API 数据	调用结构化数据 API	数据准确率 100%
信息聚合器	合并去重多源信息	去重率 > 95%
交叉验证器	多源信息一致性校验	矛盾检测率 > 85%
报告生成器	生成结构化研究报告	引用准确率 > 95%
质量审查	评估报告完整性，决定是否需要补充研究	一次通过率 > 70%

3.3 推荐技术栈

工具	用途	价格	适用场景
Claude Opus 4	研究规划和报告生成	$15/$75 per 1M tokens	深度推理和长文生成
Claude Sonnet 4	研究执行和信息提取	$3/$15 per 1M tokens	并行子任务执行
Tavily Search API	Web 搜索	免费 1000 次/月 / $50/月起	AI 优化的搜索结果
Firecrawl	网页抓取和解析	免费 500 页/月 / $19/月起	结构化网页内容提取
GPT Researcher	开源研究框架	开源免费（需 API 费用）	自动化深度研究
LangGraph	研究流程编排	开源免费	状态机驱动的研究流程
Jina Reader	网页转 Markdown	免费	网页内容清洗
Pandoc	文档格式转换	开源免费	PDF/DOCX 报告导出

3.4 系统提示词模板


你是一个专业研究分析师，负责对 [研究主题] 进行深度调研。

## 研究方法论
1. **问题分解**：将研究问题拆分为 3-7 个可独立调查的子问题
2. **多源采集**：每个子问题至少查询 3 个不同来源
3. **交叉验证**：关键数据点必须有 2+ 个独立来源确认
4. **时效性优先**：优先使用最近 6 个月内的信息来源

## 输出格式
研究报告必须包含：
- 执行摘要（200 字以内）
- 关键发现（带编号的要点列表）
- 详细分析（按子问题组织）
- 数据表格（对比分析时使用）
- 局限性说明（研究的不足和偏差）
- 参考来源（带 URL 和访问日期）

## 质量标准
- 每个事实性陈述必须标注来源
- 区分"已确认事实"和"推测/观点"
- 发现矛盾信息时，列出所有观点并分析可能原因
- 明确标注信息的时效性（截止日期）

## 工具使用
- search: 搜索互联网获取信息
- read_url: 深度阅读特定网页
- analyze_document: 解析上传的文档
- create_chart: 生成数据可视化图表

3.5 关键配置参数


research_agent_config:
  planner_model: "claude-opus-4-20250514"
  executor_model: "claude-sonnet-4-20250514"
  writer_model: "claude-opus-4-20250514"
  max_sub_questions: 7
  max_sources_per_question: 10
  parallel_executors: 5       # 并行研究执行器数量
  search:
    provider: "tavily"
    max_results: 10
    include_domains: []       # 限定搜索域名
    exclude_domains: []
  verification:
    min_sources: 2            # 关键数据最少来源数
    cross_check: true         # 启用交叉验证
  output:
    format: "markdown"        # markdown / pdf / docx
    max_length: 5000          # 报告最大字数
    include_citations: true
  timeout:
    per_question: 120s        # 单个子问题超时
    total: 600s               # 总研究超时

3.6 扩展考量

增量研究：支持在已有报告基础上追加新信息，避免重复搜索
领域专精：通过 RAG 注入领域知识库，提升专业领域研究质量
多模态：支持图表分析、视频内容提取等多模态信息源
协作模式：多个研究 Agent 分工协作，一个负责技术调研，一个负责市场分析

4. 工作流 Agent

4.1 架构概览

工作流 Agent 专注于多步骤业务流程自动化，核心特点是状态机驱动、条件分支、错误恢复和人工审批节点。与简单的自动化脚本不同，工作流 Agent 在每个节点都具备 LLM 推理能力，能处理非结构化输入和异常情况。典型应用包括客户入职、内容审核管线、数据处理流水线等。

4.2 组件清单与职责

组件	职责	关键指标
触发器	Webhook/定时/事件驱动启动工作流	触发延迟 < 1s
状态管理器	维护工作流当前状态和历史	状态持久化、崩溃恢复
步骤执行器	执行单个工作流步骤（含 LLM 推理）	步骤成功率 > 99%
条件路由	基于数据和 AI 判断选择分支	路由准确率 > 95%
人工审批节点	暂停工作流等待人工决策	通知延迟 < 5s
错误处理器	重试、降级、告警	自动恢复率 > 80%
检查点管理	保存中间状态，支持断点续执行	恢复成功率 100%
审计日志	记录每步操作和决策依据	日志完整性 100%

4.3 推荐技术栈

工具	用途	价格	适用场景
n8n	低代码工作流编排	开源免费 / 云版 €20/月起	可视化工作流、422+ 集成
LangGraph	代码级工作流编排	开源免费	复杂状态机、自定义逻辑
Temporal	持久化工作流引擎	开源免费 / 云版按量计费	高可靠性、长时间运行
Make.com	低代码自动化	免费 / $9/月起	简单自动化、快速搭建
Claude Sonnet 4	步骤内 AI 推理	$3/$15 per 1M tokens	非结构化数据处理
PostgreSQL	状态存储	开源免费	工作流状态和审计日志
Redis	任务队列	开源免费	步骤间消息传递
Slack/飞书 API	人工审批通知	免费	审批通知和交互

4.4 系统提示词模板


你是一个工作流自动化 Agent，负责执行 [业务流程名称] 流程。

## 当前步骤
步骤名称：[step_name]
步骤描述：[step_description]
输入数据：[input_data]

## 执行指令
1. 分析输入数据，提取关键信息
2. 根据以下业务规则做出决策：
   - 规则 1：[如果金额 > 10000，需要人工审批]
   - 规则 2：[如果客户等级为 VIP，走快速通道]
   - 规则 3：[如果数据不完整，返回错误并说明缺失字段]
3. 生成结构化输出

## 输出格式
必须返回 JSON 格式：
{
  "decision": "approve | reject | escalate | retry",
  "reason": "决策原因说明",
  "next_step": "下一步骤名称",
  "output_data": { ... },
  "confidence": 0.0-1.0
}

## 安全规则
- confidence < 0.7 时，必须 escalate 到人工审批
- 不修改原始输入数据
- 所有决策必须记录 reason

4.5 关键配置参数


workflow_agent_config:
  model: "claude-sonnet-4-20250514"
  temperature: 0.0            # 业务决策需要确定性
  max_tokens: 2048
  workflow:
    max_steps: 20             # 最大步骤数
    step_timeout: 60s         # 单步超时
    total_timeout: 3600s      # 工作流总超时
    checkpoint_interval: 1    # 每 N 步保存检查点
  retry:
    max_retries: 3
    backoff: "exponential"    # 指数退避
    initial_delay: 5s
  human_in_loop:
    enabled: true
    approval_timeout: 86400s  # 人工审批超时（24h）
    notification_channels: ["slack", "email"]
    escalation_threshold: 0.7 # 置信度阈值
  error_handling:
    dead_letter_queue: true   # 死信队列
    alert_on_failure: true
    fallback_path: "manual"   # 降级到人工处理

4.6 扩展考量

持久化执行：使用 Temporal/Durable Functions 确保长时间运行的工作流不丢失状态
版本管理：工作流定义版本化，支持灰度发布和回滚
并行分支：支持 fan-out/fan-in 模式并行执行多个子流程
监控仪表板：实时展示工作流执行状态、瓶颈步骤和错误率

5. 自主任务 Agent

5.1 架构概览

自主任务 Agent 是最复杂的 Agent 类型，具备目标分解、自主规划、工具选择、自我反思和迭代优化能力。与工作流 Agent 的预定义流程不同，自主任务 Agent 的执行路径是动态生成的。代表性系统包括 AutoGPT、BabyAGI、Devin 等。其核心架构采用 Plan-Act-Observe-Reflect 循环。

5.2 组件清单与职责

组件	职责	关键指标
目标解析器	将高层目标转化为可衡量的成功标准	目标明确度评分
规划器	动态生成和调整任务执行计划	计划可行性 > 80%
任务队列	管理待执行任务的优先级和依赖关系	任务调度延迟 < 100ms
执行器	选择工具并执行具体操作	单步成功率 > 85%
工具选择器	根据任务类型选择最优工具	工具匹配准确率 > 90%
观察器	收集执行结果和环境反馈	结果解析准确率 > 95%
反思器	评估进展、识别问题、调整策略	问题识别率 > 80%
工作记忆	维护当前任务的中间状态	状态一致性 100%
长期记忆	存储知识和经验供未来任务使用	检索相关性 > 85%
经验记忆	记录成功/失败模式用于策略优化	经验复用率 > 60%

5.3 推荐技术栈

工具	用途	价格	适用场景
Claude Opus 4	规划和反思推理	$15/$75 per 1M tokens	复杂目标分解和策略调整
Claude Sonnet 4	任务执行	$3/$15 per 1M tokens	具体步骤执行
LangGraph	Agent 循环编排	开源免费	状态机驱动的 Agent 循环
CrewAI	多角色协作	开源免费 / 企业版按需	角色分工的自主任务
Playwright/Puppeteer	浏览器自动化	开源免费	Web 交互和数据采集
E2B	代码沙箱	免费 100 小时/月 / $0.10/小时	安全的代码执行环境
Mem0	记忆管理	开源免费 / 云版 $49/月起	跨任务经验记忆
Qdrant	向量存储	开源免费 / 云版 $25/月起	长期知识存储

5.4 系统提示词模板


你是一个自主任务执行 Agent，能够独立完成复杂的多步骤目标。

## 目标
[用户提供的高层目标]

## 执行框架：Plan-Act-Observe-Reflect

### Plan（规划）
- 将目标分解为 3-10 个可执行的子任务
- 为每个子任务定义成功标准和预期输出
- 识别任务间的依赖关系，确定执行顺序
- 估算每个子任务的复杂度和所需工具

### Act（执行）
- 按优先级执行任务队列中的下一个任务
- 选择最合适的工具完成当前任务
- 每次只执行一个原子操作，观察结果后再继续

### Observe（观察）
- 检查执行结果是否符合预期
- 收集环境反馈和错误信息
- 更新工作记忆中的任务状态

### Reflect（反思）
- 评估当前进展与目标的距离
- 如果当前方法不奏效，分析原因并调整策略
- 如果发现新信息，更新计划
- 如果连续 3 次失败，降级到更简单的方法或请求人工帮助

## 可用工具
- execute_code: 在沙箱中执行 Python/JavaScript 代码
- web_search: 搜索互联网
- browse_url: 访问和解析网页
- read_file / write_file: 文件读写
- shell_command: 执行 shell 命令（受限）
- ask_human: 遇到无法解决的问题时请求人工帮助

## 安全边界
- 每次执行前评估操作的风险等级（低/中/高）
- 高风险操作（删除文件、发送邮件、API 写操作）需要确认
- 总预算限制：最多 [100] 次 LLM 调用，[50] 次工具调用
- 如果预算即将耗尽，总结当前进展并报告

5.5 关键配置参数


autonomous_agent_config:
  planner_model: "claude-opus-4-20250514"
  executor_model: "claude-sonnet-4-20250514"
  reflector_model: "claude-opus-4-20250514"
  temperature:
    planning: 0.3             # 规划需要一定创造性
    execution: 0.0            # 执行需要确定性
    reflection: 0.2           # 反思需要分析能力
  budget:
    max_llm_calls: 100        # LLM 调用上限
    max_tool_calls: 50        # 工具调用上限
    max_cost: 10.0            # 美元成本上限
    max_duration: 3600s       # 总时间上限
  planning:
    max_subtasks: 10
    replan_threshold: 3       # 连续失败 N 次后重新规划
    max_replans: 3            # 最大重新规划次数
  execution:
    sandbox: "e2b"            # 代码执行沙箱
    tool_timeout: 60s
    max_retries: 2
  safety:
    risk_assessment: true     # 操作前风险评估
    high_risk_confirmation: true
    blocked_operations: ["rm -rf", "DROP TABLE", "format"]
  memory:
    working_memory_size: 20   # 工作记忆条目数
    long_term_store: "qdrant"
    experience_replay: true   # 启用经验回放

5.6 扩展考量

人机协作：关键决策点设置 Human-in-the-Loop 检查点，平衡自主性和安全性
预算管理：实时追踪 token 消耗和 API 调用次数，接近上限时自动降级
经验学习：将成功的执行路径存入经验记忆，类似任务可直接复用
多 Agent 协作：复杂目标拆分给多个专业 Agent（如一个负责编码、一个负责测试、一个负责部署）

6. 五大模板对比总览

6.1 综合对比表

维度	Chatbot Agent	编码助手 Agent	研究 Agent	工作流 Agent	自主任务 Agent
复杂度	⭐⭐	⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐	⭐⭐⭐⭐⭐
自主性	低	中-高	中	低-中	高
核心循环	对话循环	Agentic Loop	规划-采集-综合	状态机	Plan-Act-Observe-Reflect
典型工具数	3-5	5-10	3-7	5-20	5-15
记忆需求	短期+长期	项目上下文	研究上下文	工作流状态	全类型记忆
人工介入	每轮对话	审查修改	审查报告	审批节点	关键决策点
延迟要求	< 2s	< 30s/步	分钟级	秒-分钟级	分钟-小时级
成本/次	$0.01-0.05	$0.10-2.00	$0.50-5.00	$0.05-0.50	$1.00-10.00
推荐框架	LangChain	Claude Code/Cursor	GPT Researcher	n8n/LangGraph	LangGraph/CrewAI
生产就绪度	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐⭐	⭐⭐

6.2 模板选择指南

根据你的使用场景，选择最合适的架构模板：

选择建议速查：

如果你需要…	选择	原因
客服机器人、FAQ 问答	Chatbot Agent	成熟稳定，成本最低
AI 辅助写代码、修 Bug	编码助手 Agent	专为代码场景优化
市场调研、竞品分析	研究 Agent	多源采集和交叉验证
订单处理、内容审核管线	工作流 Agent	状态机保证流程可靠性
”帮我完成 X”的开放式任务	自主任务 Agent	动态规划和自我修正
简单 API 调用自动化	不需要 Agent	传统脚本更高效

实战案例：从零搭建客服 + 工单升级 Agent

以下案例展示如何组合 Chatbot Agent 和工作流 Agent 模板，构建一个具备自动回答、工单创建和人工升级能力的客服系统。

场景描述

一个 SaaS 产品的客服系统，需要：

自动回答常见问题（基于知识库）
无法回答时创建工单并通知人工客服
VIP 客户自动走快速通道

架构组合

核心代码示例（LangGraph + Python）


from langgraph.graph import StateGraph, END
from typing import TypedDict, Literal
 
class CustomerState(TypedDict):
    query: str
    customer_id: str
    is_vip: bool
    kb_answer: str | None
    confidence: float
    ticket_id: str | None
 
def search_knowledge_base(state: CustomerState) -> CustomerState:
    """搜索知识库回答客户问题"""
    # RAG 检索逻辑
    answer, confidence = rag_search(state["query"])
    return {**state, "kb_answer": answer, "confidence": confidence}
 
def route_by_confidence(state: CustomerState) -> Literal["respond", "create_ticket"]:
    """根据置信度决定自动回复还是创建工单"""
    if state["confidence"] > 0.8:
        return "respond"
    return "create_ticket"
 
def auto_respond(state: CustomerState) -> CustomerState:
    """自动回复客户"""
    send_message(state["customer_id"], state["kb_answer"])
    return state
 
def create_ticket(state: CustomerState) -> CustomerState:
    """创建工单并路由"""
    priority = "high" if state["is_vip"] else "normal"
    ticket = create_support_ticket(
        query=state["query"],
        customer_id=state["customer_id"],
        priority=priority
    )
    return {**state, "ticket_id": ticket.id}
 
# 构建工作流图
graph = StateGraph(CustomerState)
graph.add_node("search_kb", search_knowledge_base)
graph.add_node("respond", auto_respond)
graph.add_node("create_ticket", create_ticket)
 
graph.set_entry_point("search_kb")
graph.add_conditional_edges("search_kb", route_by_confidence)
graph.add_edge("respond", END)
graph.add_edge("create_ticket", END)
 
app = graph.compile()

案例分析

模板组合：Chatbot 模板处理对话层，工作流模板处理升级流程，两者通过置信度阈值衔接
关键决策点：置信度 0.8 是自动回复和人工升级的分界线，需要根据实际数据调优
成本优化：80% 的常见问题由 Chatbot 自动回答（成本 ~$0.02/次），仅 20% 需要人工介入
可观测性：每次交互记录置信度、响应时间、是否升级，用于持续优化知识库

避坑指南

❌ 常见错误

过度设计：简单任务用了自主 Agent 架构
- 问题：一个 FAQ 机器人不需要 Plan-Act-Observe-Reflect 循环，过度设计导致延迟高、成本高、调试困难
- 正确做法：从最简单的 Chatbot 模板开始，只在确实需要时才升级到更复杂的架构
忽略记忆管理导致上下文丢失
- 问题：Chatbot 没有实现记忆压缩，长对话后上下文窗口溢出，Agent “失忆”
- 正确做法：设置对话轮数阈值（如 10 轮），超过后自动压缩历史为摘要
编码助手没有验证环节
- 问题：Agent 生成代码后直接提交，没有运行测试和 lint 检查，引入 Bug
- 正确做法：每次代码修改后必须运行验证器（测试 + 类型检查 + lint），失败则自动修复
研究 Agent 没有交叉验证
- 问题：只从单一来源获取信息，容易被错误信息误导，生成不准确的报告
- 正确做法：关键数据点要求至少 2 个独立来源确认，发现矛盾时标注并分析
工作流 Agent 没有错误恢复机制
- 问题：某个步骤失败后整个工作流崩溃，需要从头重新执行
- 正确做法：每步保存检查点，失败时从最近的检查点恢复，配合指数退避重试
自主 Agent 没有预算限制
- 问题：Agent 陷入无限循环，不断调用 LLM 和工具，产生巨额费用
- 正确做法：设置 LLM 调用次数、工具调用次数和美元成本的硬上限
所有步骤都用最贵的模型
- 问题：意图路由、简单分类等任务也用 Claude Opus，成本是必要的 50 倍
- 正确做法：按任务复杂度路由模型——简单任务用 mini 模型，复杂推理用大模型

✅ 最佳实践

从简单开始，按需升级：先用 Chatbot 模板验证需求，再逐步添加工具、记忆、工作流等能力
模板可组合：不同模板可以组合使用（如 Chatbot + 工作流），不必局限于单一模板
可观测性优先：从第一天就接入 LangSmith/Langfuse，追踪每次交互的成本、延迟和质量
安全边界明确：每个模板都必须配置 Guardrails，特别是自主 Agent 必须有预算和权限限制
渐进式自主：从人工审批每步操作开始，随着信任度提升逐步放宽自主权限

参考来源

AI Agent Design Patterns: Complete Guide to Agentic AI Models （2025-05）
Agentic AI Frameworks: Building Autonomous Systems in 2026 （2026-01）
AI Agent Workflows: Architecture Patterns and Templates （2025-11）
Ultimate Guide to AI Agent Architecture （2026-01）
20 Agentic AI Workflow Patterns That Actually Work in 2025 （2025-09）
Top 14 AI Agent Frameworks of 2025 （2026-01）
Building AI Agents with Composable Patterns in 2026 （2026-02）
Comparative Analysis of Deep Research Tools （2025-02）
Prompt Engineering for Production AI Agents （2026-02）

📖 返回总览与导航 | 上一节：09d-Agent记忆系统 | 下一节：09f-架构选择决策框架