09e - Agent 架构模板
本文是《AI Agent 实战手册》第 9 章第 5 节。 上一节:09d-Agent记忆系统 | 下一节:09f-架构选择决策框架
概述
架构模板是经过验证的 Agent 系统蓝图,为不同应用场景提供可复用的组件组合、技术栈选型和系统提示词模板。2025-2026 年,随着 LangGraph、CrewAI 等框架的成熟和 Claude Code、Cursor 等编码助手的普及,Agent 架构已从实验阶段进入生产落地阶段。本节提供 5 种核心 Agent 类型的完整架构模板——Chatbot Agent、编码助手 Agent、研究 Agent、工作流 Agent 和自主任务 Agent——每种模板均包含架构图、组件清单、推荐技术栈、系统提示词模板和扩展考量。
1. Chatbot Agent——对话式 AI
1.1 架构概览
Chatbot Agent 是最基础也最常见的 Agent 类型,核心能力是多轮对话、记忆管理和工具调用。现代 Chatbot 已远超传统问答机器人,具备个性化适应、上下文感知和主动工具使用能力。
1.2 组件清单与职责
| 组件 | 职责 | 关键指标 |
|---|---|---|
| API Gateway | 请求认证、限流、负载均衡 | P99 延迟 < 50ms |
| 意图路由 | 分类用户意图,分发到对应处理链 | 准确率 > 95% |
| 对话引擎 | 管理多轮对话状态和上下文 | 上下文保持 > 20 轮 |
| 工具调度器 | 解析工具调用请求,执行并返回结果 | 工具调用成功率 > 99% |
| RAG 检索 | 从知识库检索相关文档片段 | 召回率 > 85% |
| LLM 推理 | 核心推理和生成 | 首 token 延迟 < 500ms |
| 记忆管理器 | 管理短期/长期记忆的读写 | 检索延迟 < 100ms |
| Guardrails | 输入/输出安全过滤 | 拦截率 > 99.5% |
1.3 推荐技术栈
| 工具 | 用途 | 价格 | 适用场景 |
|---|---|---|---|
| Claude 3.5 Sonnet / Claude 4 | 主推理模型 | $3/$15 per 1M tokens (input/output) | 高质量对话、复杂推理 |
| GPT-4o | 主推理模型(替代) | $2.5/$10 per 1M tokens | 多模态对话、快速响应 |
| GPT-4o-mini | 意图路由/简单对话 | $0.15/$0.60 per 1M tokens | 低成本路由和简单任务 |
| Mem0 | 记忆管理 | 开源免费 / 云版 $49/月起 | 跨会话个性化记忆 |
| Qdrant | 向量数据库 | 开源免费 / 云版 $25/月起 | 长期记忆和 RAG 检索 |
| LangGraph | Agent 编排 | 开源免费 | 复杂对话流程编排 |
| Guardrails AI | 输出验证 | 开源免费 | 结构化输出和安全过滤 |
| Redis | 会话缓存 | 开源免费 / 云版 $5/月起 | 短期记忆和会话状态 |
1.4 系统提示词模板
你是 [产品名称] 的 AI 助手,专注于 [领域描述]。
## 角色定义
- 身份:[具体角色,如"专业客服顾问"]
- 语气:[友好/专业/简洁]
- 语言:[中文/英文/多语言]
## 核心能力
1. 回答关于 [领域] 的问题
2. 使用以下工具辅助用户:
- search_knowledge_base: 搜索知识库获取准确信息
- create_ticket: 创建工单转人工处理
- check_order_status: 查询订单状态
3. 记住用户偏好和历史交互
## 行为规则
- 不确定时,使用 search_knowledge_base 工具查询,不要编造信息
- 超出能力范围时,使用 create_ticket 转人工
- 每次回复控制在 [200] 字以内,除非用户要求详细解释
- 涉及敏感信息(支付、密码)时,引导用户通过安全渠道处理
## 记忆指令
- 记住用户的姓名、偏好和常见问题
- 引用之前的对话内容保持连贯性1.5 关键配置参数
chatbot_config:
model: "claude-sonnet-4-20250514"
temperature: 0.7 # 对话自然度
max_tokens: 1024 # 单次回复上限
context_window: 20 # 保留最近 N 轮对话
memory:
short_term: "redis" # 会话级缓存
long_term: "qdrant" # 跨会话记忆
summarize_after: 10 # 超过 N 轮后压缩历史
guardrails:
max_input_length: 2000
blocked_topics: ["政治", "暴力", "色情"]
pii_detection: true
tools:
max_tool_calls: 5 # 单次最多工具调用次数
timeout: 10s # 工具调用超时1.6 扩展考量
- 水平扩展:无状态设计 + Redis 会话存储,支持多实例部署
- 成本优化:简单意图用小模型路由(GPT-4o-mini),复杂问题用大模型
- 多语言:使用语言检测自动切换提示词模板
- 监控:接入 LangSmith/Langfuse 追踪每次对话的 token 消耗和延迟
2. 编码助手 Agent
2.1 架构概览
编码助手 Agent 是 2025-2026 年发展最快的 Agent 类型,以 Claude Code、Cursor、GitHub Copilot 为代表。其核心架构围绕”理解代码库→规划修改→执行变更→验证结果”的 Agentic Loop 展开,具备文件系统操作、命令执行、代码分析等能力。
2.2 组件清单与职责
| 组件 | 职责 | 关键指标 |
|---|---|---|
| 指令解析器 | 理解开发者的自然语言意图 | 意图识别准确率 > 90% |
| 任务规划器 | 将复杂任务分解为可执行的子步骤 | Plan Mode 规划质量 |
| 代码阅读器 | 解析项目结构、AST、依赖关系 | 支持 20+ 语言 |
| 上下文构建器 | 组装相关文件、规则、历史到上下文窗口 | 上下文利用率 > 80% |
| LLM 推理引擎 | 代码生成、Bug 修复、重构推理 | 首次通过率 > 70% |
| 文件系统 | 读写项目文件 | 操作延迟 < 10ms |
| 代码编辑器 | AST 级别的精确代码修改 | 编辑成功率 > 95% |
| Shell 执行器 | 运行测试、构建、lint 等命令 | 命令超时保护 |
| 代码搜索 | 语义搜索和正则搜索代码库 | 搜索延迟 < 200ms |
| 验证器 | 运行测试、类型检查、lint 验证修改 | 自动修复率 > 60% |
2.3 推荐技术栈
| 工具 | 用途 | 价格 | 适用场景 |
|---|---|---|---|
| Claude Code | CLI 编码助手 | Max 订阅 $100/月 或 API 按量 | 终端原生、自主编码 |
| Cursor | IDE 集成编码助手 | Pro $20/月 | IDE 内编码、多文件编辑 |
| GitHub Copilot | IDE 补全 + Agent | Individual $10/月 | 代码补全、PR 审查 |
| Claude Sonnet 4 | 编码推理模型 | $3/$15 per 1M tokens | 复杂代码生成和重构 |
| Claude Opus 4 | 深度推理模型 | $15/$75 per 1M tokens | 架构设计、复杂 Bug 修复 |
| tree-sitter | AST 解析 | 开源免费 | 多语言代码结构分析 |
| ripgrep | 代码搜索 | 开源免费 | 快速全文搜索 |
| Kiro | Spec-Driven IDE | 免费预览版 | 需求→设计→任务驱动开发 |
2.4 系统提示词模板
你是一个高级编码助手,在 [项目名称] 项目中工作。
## 项目上下文
- 技术栈:[TypeScript/React/Node.js]
- 包管理器:[pnpm]
- 测试框架:[Vitest]
- 代码风格:[ESLint + Prettier]
## 工作流程
1. 收到任务后,先阅读相关文件理解现有代码
2. 制定修改计划,列出需要修改的文件和原因
3. 逐步执行修改,每次修改后运行相关测试
4. 如果测试失败,分析原因并修复
5. 所有测试通过后,总结所做的修改
## 编码规则
- 遵循项目现有的代码风格和命名约定
- 新增功能必须包含单元测试
- 不修改不相关的文件
- 使用 TypeScript 严格模式,不使用 any 类型
- 优先使用项目已有的工具库,避免引入新依赖
## 工具使用
- 使用 readCode 理解代码结构
- 使用 editCode 进行 AST 级别的精确修改
- 使用 executeBash 运行测试和构建命令
- 使用 grepSearch 搜索代码库中的模式
## 安全边界
- 不执行 rm -rf 或其他危险命令
- 不修改 .env 文件中的密钥
- 不提交包含敏感信息的代码2.5 关键配置参数
coding_assistant_config:
model: "claude-sonnet-4-20250514"
thinking_model: "claude-opus-4-20250514" # 复杂任务用
temperature: 0.0 # 代码生成需要确定性
max_tokens: 16384 # 支持大段代码生成
context:
max_files: 50 # 单次上下文最多文件数
max_context_tokens: 100000
rule_files: ["CLAUDE.md", ".cursorrules"]
execution:
shell_timeout: 120s # 命令执行超时
max_retries: 3 # 测试失败最大重试次数
sandbox: true # 沙箱模式
verification:
run_tests: true
run_lint: true
run_typecheck: true
auto_fix: true # 自动修复 lint 错误2.6 扩展考量
- Subagent 模式:复杂任务拆分为多个 Subagent 并行执行(如一个写代码、一个写测试)
- 上下文管理:大型代码库使用 RAG + AST 索引,避免上下文溢出
- 成本控制:简单补全用小模型,复杂重构用大模型,通过路由降低成本
- 安全沙箱:使用 Docker/gVisor 隔离命令执行环境
3. 研究 Agent
3.1 架构概览
研究 Agent 是 Deep Research 类产品(如 Perplexity Deep Research、ChatGPT Deep Research、GPT Researcher)的核心架构。其特点是自主规划研究路径、并行信息采集、多源交叉验证和结构化报告生成。典型架构采用”规划者-执行者-发布者”三层模式。
3.2 组件清单与职责
| 组件 | 职责 | 关键指标 |
|---|---|---|
| 研究规划器 | 分解研究问题为子问题,制定研究策略 | 子问题覆盖率 > 90% |
| 研究执行器 | 针对单个子问题执行信息采集 | 并行执行 3-10 个 |
| Web 搜索 | 搜索互联网获取最新信息 | 搜索结果相关性 > 80% |
| 文档解析 | 解析 PDF、网页、论文等文档 | 支持 10+ 格式 |
| API 数据 | 调用结构化数据 API | 数据准确率 100% |
| 信息聚合器 | 合并去重多源信息 | 去重率 > 95% |
| 交叉验证器 | 多源信息一致性校验 | 矛盾检测率 > 85% |
| 报告生成器 | 生成结构化研究报告 | 引用准确率 > 95% |
| 质量审查 | 评估报告完整性,决定是否需要补充研究 | 一次通过率 > 70% |
3.3 推荐技术栈
| 工具 | 用途 | 价格 | 适用场景 |
|---|---|---|---|
| Claude Opus 4 | 研究规划和报告生成 | $15/$75 per 1M tokens | 深度推理和长文生成 |
| Claude Sonnet 4 | 研究执行和信息提取 | $3/$15 per 1M tokens | 并行子任务执行 |
| Tavily Search API | Web 搜索 | 免费 1000 次/月 / $50/月起 | AI 优化的搜索结果 |
| Firecrawl | 网页抓取和解析 | 免费 500 页/月 / $19/月起 | 结构化网页内容提取 |
| GPT Researcher | 开源研究框架 | 开源免费(需 API 费用) | 自动化深度研究 |
| LangGraph | 研究流程编排 | 开源免费 | 状态机驱动的研究流程 |
| Jina Reader | 网页转 Markdown | 免费 | 网页内容清洗 |
| Pandoc | 文档格式转换 | 开源免费 | PDF/DOCX 报告导出 |
3.4 系统提示词模板
你是一个专业研究分析师,负责对 [研究主题] 进行深度调研。
## 研究方法论
1. **问题分解**:将研究问题拆分为 3-7 个可独立调查的子问题
2. **多源采集**:每个子问题至少查询 3 个不同来源
3. **交叉验证**:关键数据点必须有 2+ 个独立来源确认
4. **时效性优先**:优先使用最近 6 个月内的信息来源
## 输出格式
研究报告必须包含:
- 执行摘要(200 字以内)
- 关键发现(带编号的要点列表)
- 详细分析(按子问题组织)
- 数据表格(对比分析时使用)
- 局限性说明(研究的不足和偏差)
- 参考来源(带 URL 和访问日期)
## 质量标准
- 每个事实性陈述必须标注来源
- 区分"已确认事实"和"推测/观点"
- 发现矛盾信息时,列出所有观点并分析可能原因
- 明确标注信息的时效性(截止日期)
## 工具使用
- search: 搜索互联网获取信息
- read_url: 深度阅读特定网页
- analyze_document: 解析上传的文档
- create_chart: 生成数据可视化图表3.5 关键配置参数
research_agent_config:
planner_model: "claude-opus-4-20250514"
executor_model: "claude-sonnet-4-20250514"
writer_model: "claude-opus-4-20250514"
max_sub_questions: 7
max_sources_per_question: 10
parallel_executors: 5 # 并行研究执行器数量
search:
provider: "tavily"
max_results: 10
include_domains: [] # 限定搜索域名
exclude_domains: []
verification:
min_sources: 2 # 关键数据最少来源数
cross_check: true # 启用交叉验证
output:
format: "markdown" # markdown / pdf / docx
max_length: 5000 # 报告最大字数
include_citations: true
timeout:
per_question: 120s # 单个子问题超时
total: 600s # 总研究超时3.6 扩展考量
- 增量研究:支持在已有报告基础上追加新信息,避免重复搜索
- 领域专精:通过 RAG 注入领域知识库,提升专业领域研究质量
- 多模态:支持图表分析、视频内容提取等多模态信息源
- 协作模式:多个研究 Agent 分工协作,一个负责技术调研,一个负责市场分析
4. 工作流 Agent
4.1 架构概览
工作流 Agent 专注于多步骤业务流程自动化,核心特点是状态机驱动、条件分支、错误恢复和人工审批节点。与简单的自动化脚本不同,工作流 Agent 在每个节点都具备 LLM 推理能力,能处理非结构化输入和异常情况。典型应用包括客户入职、内容审核管线、数据处理流水线等。
4.2 组件清单与职责
| 组件 | 职责 | 关键指标 |
|---|---|---|
| 触发器 | Webhook/定时/事件驱动启动工作流 | 触发延迟 < 1s |
| 状态管理器 | 维护工作流当前状态和历史 | 状态持久化、崩溃恢复 |
| 步骤执行器 | 执行单个工作流步骤(含 LLM 推理) | 步骤成功率 > 99% |
| 条件路由 | 基于数据和 AI 判断选择分支 | 路由准确率 > 95% |
| 人工审批节点 | 暂停工作流等待人工决策 | 通知延迟 < 5s |
| 错误处理器 | 重试、降级、告警 | 自动恢复率 > 80% |
| 检查点管理 | 保存中间状态,支持断点续执行 | 恢复成功率 100% |
| 审计日志 | 记录每步操作和决策依据 | 日志完整性 100% |
4.3 推荐技术栈
| 工具 | 用途 | 价格 | 适用场景 |
|---|---|---|---|
| n8n | 低代码工作流编排 | 开源免费 / 云版 €20/月起 | 可视化工作流、422+ 集成 |
| LangGraph | 代码级工作流编排 | 开源免费 | 复杂状态机、自定义逻辑 |
| Temporal | 持久化工作流引擎 | 开源免费 / 云版按量计费 | 高可靠性、长时间运行 |
| Make.com | 低代码自动化 | 免费 / $9/月起 | 简单自动化、快速搭建 |
| Claude Sonnet 4 | 步骤内 AI 推理 | $3/$15 per 1M tokens | 非结构化数据处理 |
| PostgreSQL | 状态存储 | 开源免费 | 工作流状态和审计日志 |
| Redis | 任务队列 | 开源免费 | 步骤间消息传递 |
| Slack/飞书 API | 人工审批通知 | 免费 | 审批通知和交互 |
4.4 系统提示词模板
你是一个工作流自动化 Agent,负责执行 [业务流程名称] 流程。
## 当前步骤
步骤名称:[step_name]
步骤描述:[step_description]
输入数据:[input_data]
## 执行指令
1. 分析输入数据,提取关键信息
2. 根据以下业务规则做出决策:
- 规则 1:[如果金额 > 10000,需要人工审批]
- 规则 2:[如果客户等级为 VIP,走快速通道]
- 规则 3:[如果数据不完整,返回错误并说明缺失字段]
3. 生成结构化输出
## 输出格式
必须返回 JSON 格式:
{
"decision": "approve | reject | escalate | retry",
"reason": "决策原因说明",
"next_step": "下一步骤名称",
"output_data": { ... },
"confidence": 0.0-1.0
}
## 安全规则
- confidence < 0.7 时,必须 escalate 到人工审批
- 不修改原始输入数据
- 所有决策必须记录 reason4.5 关键配置参数
workflow_agent_config:
model: "claude-sonnet-4-20250514"
temperature: 0.0 # 业务决策需要确定性
max_tokens: 2048
workflow:
max_steps: 20 # 最大步骤数
step_timeout: 60s # 单步超时
total_timeout: 3600s # 工作流总超时
checkpoint_interval: 1 # 每 N 步保存检查点
retry:
max_retries: 3
backoff: "exponential" # 指数退避
initial_delay: 5s
human_in_loop:
enabled: true
approval_timeout: 86400s # 人工审批超时(24h)
notification_channels: ["slack", "email"]
escalation_threshold: 0.7 # 置信度阈值
error_handling:
dead_letter_queue: true # 死信队列
alert_on_failure: true
fallback_path: "manual" # 降级到人工处理4.6 扩展考量
- 持久化执行:使用 Temporal/Durable Functions 确保长时间运行的工作流不丢失状态
- 版本管理:工作流定义版本化,支持灰度发布和回滚
- 并行分支:支持 fan-out/fan-in 模式并行执行多个子流程
- 监控仪表板:实时展示工作流执行状态、瓶颈步骤和错误率
5. 自主任务 Agent
5.1 架构概览
自主任务 Agent 是最复杂的 Agent 类型,具备目标分解、自主规划、工具选择、自我反思和迭代优化能力。与工作流 Agent 的预定义流程不同,自主任务 Agent 的执行路径是动态生成的。代表性系统包括 AutoGPT、BabyAGI、Devin 等。其核心架构采用 Plan-Act-Observe-Reflect 循环。
5.2 组件清单与职责
| 组件 | 职责 | 关键指标 |
|---|---|---|
| 目标解析器 | 将高层目标转化为可衡量的成功标准 | 目标明确度评分 |
| 规划器 | 动态生成和调整任务执行计划 | 计划可行性 > 80% |
| 任务队列 | 管理待执行任务的优先级和依赖关系 | 任务调度延迟 < 100ms |
| 执行器 | 选择工具并执行具体操作 | 单步成功率 > 85% |
| 工具选择器 | 根据任务类型选择最优工具 | 工具匹配准确率 > 90% |
| 观察器 | 收集执行结果和环境反馈 | 结果解析准确率 > 95% |
| 反思器 | 评估进展、识别问题、调整策略 | 问题识别率 > 80% |
| 工作记忆 | 维护当前任务的中间状态 | 状态一致性 100% |
| 长期记忆 | 存储知识和经验供未来任务使用 | 检索相关性 > 85% |
| 经验记忆 | 记录成功/失败模式用于策略优化 | 经验复用率 > 60% |
5.3 推荐技术栈
| 工具 | 用途 | 价格 | 适用场景 |
|---|---|---|---|
| Claude Opus 4 | 规划和反思推理 | $15/$75 per 1M tokens | 复杂目标分解和策略调整 |
| Claude Sonnet 4 | 任务执行 | $3/$15 per 1M tokens | 具体步骤执行 |
| LangGraph | Agent 循环编排 | 开源免费 | 状态机驱动的 Agent 循环 |
| CrewAI | 多角色协作 | 开源免费 / 企业版按需 | 角色分工的自主任务 |
| Playwright/Puppeteer | 浏览器自动化 | 开源免费 | Web 交互和数据采集 |
| E2B | 代码沙箱 | 免费 100 小时/月 / $0.10/小时 | 安全的代码执行环境 |
| Mem0 | 记忆管理 | 开源免费 / 云版 $49/月起 | 跨任务经验记忆 |
| Qdrant | 向量存储 | 开源免费 / 云版 $25/月起 | 长期知识存储 |
5.4 系统提示词模板
你是一个自主任务执行 Agent,能够独立完成复杂的多步骤目标。
## 目标
[用户提供的高层目标]
## 执行框架:Plan-Act-Observe-Reflect
### Plan(规划)
- 将目标分解为 3-10 个可执行的子任务
- 为每个子任务定义成功标准和预期输出
- 识别任务间的依赖关系,确定执行顺序
- 估算每个子任务的复杂度和所需工具
### Act(执行)
- 按优先级执行任务队列中的下一个任务
- 选择最合适的工具完成当前任务
- 每次只执行一个原子操作,观察结果后再继续
### Observe(观察)
- 检查执行结果是否符合预期
- 收集环境反馈和错误信息
- 更新工作记忆中的任务状态
### Reflect(反思)
- 评估当前进展与目标的距离
- 如果当前方法不奏效,分析原因并调整策略
- 如果发现新信息,更新计划
- 如果连续 3 次失败,降级到更简单的方法或请求人工帮助
## 可用工具
- execute_code: 在沙箱中执行 Python/JavaScript 代码
- web_search: 搜索互联网
- browse_url: 访问和解析网页
- read_file / write_file: 文件读写
- shell_command: 执行 shell 命令(受限)
- ask_human: 遇到无法解决的问题时请求人工帮助
## 安全边界
- 每次执行前评估操作的风险等级(低/中/高)
- 高风险操作(删除文件、发送邮件、API 写操作)需要确认
- 总预算限制:最多 [100] 次 LLM 调用,[50] 次工具调用
- 如果预算即将耗尽,总结当前进展并报告5.5 关键配置参数
autonomous_agent_config:
planner_model: "claude-opus-4-20250514"
executor_model: "claude-sonnet-4-20250514"
reflector_model: "claude-opus-4-20250514"
temperature:
planning: 0.3 # 规划需要一定创造性
execution: 0.0 # 执行需要确定性
reflection: 0.2 # 反思需要分析能力
budget:
max_llm_calls: 100 # LLM 调用上限
max_tool_calls: 50 # 工具调用上限
max_cost: 10.0 # 美元成本上限
max_duration: 3600s # 总时间上限
planning:
max_subtasks: 10
replan_threshold: 3 # 连续失败 N 次后重新规划
max_replans: 3 # 最大重新规划次数
execution:
sandbox: "e2b" # 代码执行沙箱
tool_timeout: 60s
max_retries: 2
safety:
risk_assessment: true # 操作前风险评估
high_risk_confirmation: true
blocked_operations: ["rm -rf", "DROP TABLE", "format"]
memory:
working_memory_size: 20 # 工作记忆条目数
long_term_store: "qdrant"
experience_replay: true # 启用经验回放5.6 扩展考量
- 人机协作:关键决策点设置 Human-in-the-Loop 检查点,平衡自主性和安全性
- 预算管理:实时追踪 token 消耗和 API 调用次数,接近上限时自动降级
- 经验学习:将成功的执行路径存入经验记忆,类似任务可直接复用
- 多 Agent 协作:复杂目标拆分给多个专业 Agent(如一个负责编码、一个负责测试、一个负责部署)
6. 五大模板对比总览
6.1 综合对比表
| 维度 | Chatbot Agent | 编码助手 Agent | 研究 Agent | 工作流 Agent | 自主任务 Agent |
|---|---|---|---|---|---|
| 复杂度 | ⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| 自主性 | 低 | 中-高 | 中 | 低-中 | 高 |
| 核心循环 | 对话循环 | Agentic Loop | 规划-采集-综合 | 状态机 | Plan-Act-Observe-Reflect |
| 典型工具数 | 3-5 | 5-10 | 3-7 | 5-20 | 5-15 |
| 记忆需求 | 短期+长期 | 项目上下文 | 研究上下文 | 工作流状态 | 全类型记忆 |
| 人工介入 | 每轮对话 | 审查修改 | 审查报告 | 审批节点 | 关键决策点 |
| 延迟要求 | < 2s | < 30s/步 | 分钟级 | 秒-分钟级 | 分钟-小时级 |
| 成本/次 | $0.01-0.05 | $0.10-2.00 | $0.50-5.00 | $0.05-0.50 | $1.00-10.00 |
| 推荐框架 | LangChain | Claude Code/Cursor | GPT Researcher | n8n/LangGraph | LangGraph/CrewAI |
| 生产就绪度 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐ |
6.2 模板选择指南
根据你的使用场景,选择最合适的架构模板:
选择建议速查:
| 如果你需要… | 选择 | 原因 |
|---|---|---|
| 客服机器人、FAQ 问答 | Chatbot Agent | 成熟稳定,成本最低 |
| AI 辅助写代码、修 Bug | 编码助手 Agent | 专为代码场景优化 |
| 市场调研、竞品分析 | 研究 Agent | 多源采集和交叉验证 |
| 订单处理、内容审核管线 | 工作流 Agent | 状态机保证流程可靠性 |
| ”帮我完成 X”的开放式任务 | 自主任务 Agent | 动态规划和自我修正 |
| 简单 API 调用自动化 | 不需要 Agent | 传统脚本更高效 |
实战案例:从零搭建客服 + 工单升级 Agent
以下案例展示如何组合 Chatbot Agent 和工作流 Agent 模板,构建一个具备自动回答、工单创建和人工升级能力的客服系统。
场景描述
一个 SaaS 产品的客服系统,需要:
- 自动回答常见问题(基于知识库)
- 无法回答时创建工单并通知人工客服
- VIP 客户自动走快速通道
架构组合
核心代码示例(LangGraph + Python)
from langgraph.graph import StateGraph, END
from typing import TypedDict, Literal
class CustomerState(TypedDict):
query: str
customer_id: str
is_vip: bool
kb_answer: str | None
confidence: float
ticket_id: str | None
def search_knowledge_base(state: CustomerState) -> CustomerState:
"""搜索知识库回答客户问题"""
# RAG 检索逻辑
answer, confidence = rag_search(state["query"])
return {**state, "kb_answer": answer, "confidence": confidence}
def route_by_confidence(state: CustomerState) -> Literal["respond", "create_ticket"]:
"""根据置信度决定自动回复还是创建工单"""
if state["confidence"] > 0.8:
return "respond"
return "create_ticket"
def auto_respond(state: CustomerState) -> CustomerState:
"""自动回复客户"""
send_message(state["customer_id"], state["kb_answer"])
return state
def create_ticket(state: CustomerState) -> CustomerState:
"""创建工单并路由"""
priority = "high" if state["is_vip"] else "normal"
ticket = create_support_ticket(
query=state["query"],
customer_id=state["customer_id"],
priority=priority
)
return {**state, "ticket_id": ticket.id}
# 构建工作流图
graph = StateGraph(CustomerState)
graph.add_node("search_kb", search_knowledge_base)
graph.add_node("respond", auto_respond)
graph.add_node("create_ticket", create_ticket)
graph.set_entry_point("search_kb")
graph.add_conditional_edges("search_kb", route_by_confidence)
graph.add_edge("respond", END)
graph.add_edge("create_ticket", END)
app = graph.compile()案例分析
- 模板组合:Chatbot 模板处理对话层,工作流模板处理升级流程,两者通过置信度阈值衔接
- 关键决策点:置信度 0.8 是自动回复和人工升级的分界线,需要根据实际数据调优
- 成本优化:80% 的常见问题由 Chatbot 自动回答(成本 ~$0.02/次),仅 20% 需要人工介入
- 可观测性:每次交互记录置信度、响应时间、是否升级,用于持续优化知识库
避坑指南
❌ 常见错误
-
过度设计:简单任务用了自主 Agent 架构
- 问题:一个 FAQ 机器人不需要 Plan-Act-Observe-Reflect 循环,过度设计导致延迟高、成本高、调试困难
- 正确做法:从最简单的 Chatbot 模板开始,只在确实需要时才升级到更复杂的架构
-
忽略记忆管理导致上下文丢失
- 问题:Chatbot 没有实现记忆压缩,长对话后上下文窗口溢出,Agent “失忆”
- 正确做法:设置对话轮数阈值(如 10 轮),超过后自动压缩历史为摘要
-
编码助手没有验证环节
- 问题:Agent 生成代码后直接提交,没有运行测试和 lint 检查,引入 Bug
- 正确做法:每次代码修改后必须运行验证器(测试 + 类型检查 + lint),失败则自动修复
-
研究 Agent 没有交叉验证
- 问题:只从单一来源获取信息,容易被错误信息误导,生成不准确的报告
- 正确做法:关键数据点要求至少 2 个独立来源确认,发现矛盾时标注并分析
-
工作流 Agent 没有错误恢复机制
- 问题:某个步骤失败后整个工作流崩溃,需要从头重新执行
- 正确做法:每步保存检查点,失败时从最近的检查点恢复,配合指数退避重试
-
自主 Agent 没有预算限制
- 问题:Agent 陷入无限循环,不断调用 LLM 和工具,产生巨额费用
- 正确做法:设置 LLM 调用次数、工具调用次数和美元成本的硬上限
-
所有步骤都用最贵的模型
- 问题:意图路由、简单分类等任务也用 Claude Opus,成本是必要的 50 倍
- 正确做法:按任务复杂度路由模型——简单任务用 mini 模型,复杂推理用大模型
✅ 最佳实践
- 从简单开始,按需升级:先用 Chatbot 模板验证需求,再逐步添加工具、记忆、工作流等能力
- 模板可组合:不同模板可以组合使用(如 Chatbot + 工作流),不必局限于单一模板
- 可观测性优先:从第一天就接入 LangSmith/Langfuse,追踪每次交互的成本、延迟和质量
- 安全边界明确:每个模板都必须配置 Guardrails,特别是自主 Agent 必须有预算和权限限制
- 渐进式自主:从人工审批每步操作开始,随着信任度提升逐步放宽自主权限
相关资源与延伸阅读
- LangGraph 官方文档 — Agent 架构指南 — LangGraph 状态机编排的完整教程和示例
- Anthropic — Building Effective Agents — Anthropic 官方的 Agent 构建最佳实践
- OpenAI Cookbook — Agent 设计模式 — OpenAI 提供的 Agent 实现示例集
- GPT Researcher — 开源研究 Agent — 研究 Agent 架构的参考实现
- CrewAI 文档 — 多角色 Agent 框架 — 角色制 Agent 协作框架
- n8n AI Agent 节点文档 — 低代码工作流 Agent 配置指南
- Mem0 — Agent 记忆层 — 开源 Agent 记忆管理框架
- E2B — AI 代码沙箱 — 安全的 Agent 代码执行环境
参考来源
- AI Agent Design Patterns: Complete Guide to Agentic AI Models (2025-05)
- Agentic AI Frameworks: Building Autonomous Systems in 2026 (2026-01)
- AI Agent Workflows: Architecture Patterns and Templates (2025-11)
- Ultimate Guide to AI Agent Architecture (2026-01)
- 20 Agentic AI Workflow Patterns That Actually Work in 2025 (2025-09)
- Top 14 AI Agent Frameworks of 2025 (2026-01)
- Building AI Agents with Composable Patterns in 2026 (2026-02)
- Comparative Analysis of Deep Research Tools (2025-02)
- Prompt Engineering for Production AI Agents (2026-02)
📖 返回 总览与导航 | 上一节:09d-Agent记忆系统 | 下一节:09f-架构选择决策框架