37a 全景架构与决策框架
上一篇: 36g 第六周:发布与增长 | 下一篇: 37b 飞书机器人与 MCP 搭建
本章介绍如何为一个 30 人左右的团队搭建完整的 AI Agent 工作流体系,以飞书为协作中枢,OpenClaw 为 Agent 运行时,覆盖产品、设计、开发、测试、运维、运营、人事、交付等全部门。方案充分利用 OpenClaw 的 Skill 系统、记忆系统和飞书插件,通过 MCP 协议对接各类工具,最大化 Agent 的自动化能力。
1. 为什么需要 Agent 全工作流
传统团队协作的痛点:
| 痛点 | 表现 | Agent 解决方式 |
|---|---|---|
| 信息孤岛 | 需求在飞书群聊、多维表格、文档中分散 | Agent 统一收集,自动归档到多维表格 |
| 手动重复劳动 | 每周手写工作总结、手动更新看板 | Agent 自动汇总、自动更新状态 |
| 数据分析滞后 | 需要找数据同事跑 SQL、等报告 | Agent 实时查询数据库,即时生成分析 |
| 知识流失 | 老员工离职带走经验 | OpenClaw 记忆系统 + RAG 知识库沉淀所有决策和方案 |
| 跨部门协作低效 | 产品提需求→开发排期→测试验收链路长 | Agent 自动流转,Skill 驱动状态机 |
| 技能不可复用 | 每个自动化都要重新开发 | Skill 文件可复用、可版本管理、可热更新 |
2. 为什么选择 OpenClaw
| 维度 | OpenClaw | 纯编码方案 |
|---|---|---|
| 飞书对接 | feishu 插件,配置即用,WebSocket 长连接 | 需要自己写 SDK 集成和消息处理 |
| Skill 系统 | markdown 文件定义,热更新,无需重启 | YAML + 代码方法,改逻辑需重新部署 |
| 记忆系统 | 内置持久化记忆(markdown 文件),跨会话保留 | 需要自建对话历史 + 向量检索 |
| 脚本执行 | Skill 可直接执行 shell 脚本、调用 API | 需要在代码里封装每个操作 |
| MCP 支持 | 内置 MCP Client,配置即用 | 需要自己集成 MCP Client 库 |
| 多 Agent 协作 | 内置 Agent 间通信和任务委派 | 需要自己设计协作协议 |
| 部署运维 | daemon 模式,一键安装,持久运行 | 需要自己搭建后端服务、进程管理 |
| 上手成本 | 写 Skill 文件即可,代码量极少 | 需要写完整的后端服务 |
结论:OpenClaw 的 Skill 系统 + 记忆系统 + 飞书插件 + MCP 支持,正好覆盖了企业级 Agent 工作流的全部基础设施需求。团队只需要专注于编写 Skill 和配置 MCP 工具,不需要从零搭建 Agent 运行时。
3. 整体架构设计
┌─────────────────────────────────────────────────────┐
│ 飞书(用户界面层) │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │ 私聊对话 │ │ 群组@机器人│ │ 多维表格 │ │
│ └────┬─────┘ └────┬─────┘ └────┬─────┘ │
└───────┼──────────────┼─────────────┼────────────────┘
│ │ │
▼ ▼ ▼
┌─────────────────────────────────────────────────────┐
│ OpenClaw Gateway(Agent 运行时) │
│ │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │feishu │ │意图识别 │ │记忆系统 │ │
│ │插件 │ │& 路由 │ │(markdown │ │
│ │(WebSocket)│ │ │ │ 持久化) │ │
│ └──────────┘ └──────────┘ └──────────┘ │
└───────┬──────────────┬─────────────┬────────────────┘
│ │ │
▼ ▼ ▼
┌─────────────────────────────────────────────────────┐
│ Skill 管理层(编排 & 治理) │
│ │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │Skill 注册 │ │版本管理 │ │权限 & 审计│ │
│ │& 发现 │ │& 热更新 │ │& 监控 │ │
│ └──────────┘ └──────────┘ └──────────┘ │
└───────┬──────────────┬─────────────┬────────────────┘
│ │ │
▼ ▼ ▼
┌─────────────────────────────────────────────────────┐
│ Skill 执行层(7 组专职 Skill) │
│ │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │① 需求/缺陷│ │② 代码 │ │③ 运维 │ │
│ │ Skills │ │ Skills │ │ Skills │ │
│ │ │ │ │ │ │ │
│ │·需求收集 │ │·PR查看/审查│ │·日志查询 │ │
│ │·缺陷创建 │ │·代码搜索 │ │·服务状态 │ │
│ │·状态流转 │ │·CI/CD触发 │ │·告警处理 │ │
│ │·PRD生成 │ │·分支管理 │ │·部署触发 │ │
│ └──────────┘ └──────────┘ └──────────┘ │
│ │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌────────┐ │
│ │④ 数据分析 │ │⑤ 团队管理 │ │⑥ 知识库 │ │⑦ 运营 │ │
│ │ Skills │ │ Skills │ │ Skills │ │ Skills │ │
│ │ │ │ │ │ │ │ │ │
│ │·SQL查询 │ │·工作总结 │ │·RAG检索 │ │·增长策略│ │
│ │·GA数据 │ │·OKR跟踪 │ │·文档问答 │ │·竞品分析│ │
│ │·报表生成 │ │·人事流程 │ │·知识沉淀 │ │·内容生成│ │
│ │·趋势分析 │ │·交付管理 │ │·经验传承 │ │·社区运营│ │
│ └──────────┘ └──────────┘ └──────────┘ └────────┘ │
└───────┬──────────────┬─────────────┬────────────────┘
│ │ │
▼ ▼ ▼
┌─────────────────────────────────────────────────────┐
│ 工具层(MCP + API) │
│ │
│ ┌────────┐ ┌────────┐ ┌────────┐ ┌──────┐ ┌─────┐│
│ │飞书MCP │ │GitHub │ │业务DB │ │Google│ │向量 ││
│ │(多维表格 │ │MCP │ │(Pg/ │ │Analy-│ │数据库││
│ │文档 日历)│ │(PR/代码)│ │MySQL) │ │tics │ │(RAG)││
│ └────────┘ └────────┘ └────────┘ └──────┘ └─────┘│
│ ┌────────┐ ┌────────┐ ┌────────┐ │
│ │云平台API│ │Sentry │ │Figma │ │
│ │(GCP/AWS)│ │(错误追踪)│ │API │ │
│ └────────┘ └────────┘ └────────┘ │
└─────────────────────────────────────────────────────┘3.1 为什么选择单机器人 + 多 Skill 路由
| 方案 | 优点 | 缺点 |
|---|---|---|
| 多个飞书机器人 | 职责清晰 | 每个机器人需独立申请权限、审批发布;用户需记住多个机器人名字;运维成本高 |
| 单机器人 + OpenClaw 路由 | 统一入口,用户体验好;OpenClaw 自动识别意图路由到对应 Skill;权限集中管理 | 需要设计好 Skill 的命名和分类 |
结论:对 30 人团队,单机器人 + OpenClaw 意图路由是最优方案。用户只需 @一个机器人,OpenClaw 根据消息内容自动选择合适的 Skill 执行。
进阶:当 Skill 数量超过 15 个后,建议切换到多 Agent 模式 — 在 OpenClaw 内部配置多个领域 Agent(产品、开发、数据、团队),由 Router Agent 做两级路由。详见 37d 第 3 节:多 Agent 编排与配置。
4. 技术选型
4.1 核心技术栈
| 组件 | 选型 | 理由 |
|---|---|---|
| Agent 运行时 | OpenClaw | Skill 系统 + 记忆系统 + 飞书插件 + MCP 支持,开箱即用 |
| 飞书对接 | OpenClaw feishu 插件 | WebSocket 长连接,无需公网 IP,配置即用 |
| 飞书 API | @larksuiteoapi/lark-mcp(飞书官方 MCP) | 封装飞书全部 API,多维表格/文档/日历/消息 |
| 多维表格增强 | bitable-mcp | 支持 SQL 查询多维表格 |
| 代码管理 | GitHub MCP Server(官方) | PR 查看、代码搜索、Issue 管理、CI/CD 触发 |
| 运维监控 | 云平台 API + Sentry API | 日志查询、服务状态、错误追踪、部署管理 |
| LLM | Claude Sonnet(主力)+ Haiku(轻量路由) | OpenClaw 内置模型配置 |
| 向量数据库 | Chroma(轻量)/ Weaviate(生产级) | RAG 知识库检索 |
| 数据库 | PostgreSQL + pgvector | 业务数据 + 向量存储一体化 |
4.2 MCP 工具能力矩阵
| 工具层 | MCP/API | 支持的操作 | 对应 Skill 组 |
|---|---|---|---|
| 飞书消息 | lark-openapi-mcp | 发送/接收消息、创建群组、管理群成员 | 所有 Skill |
| 飞书多维表格 | lark-openapi-mcp | 创建应用/表/字段、增删改查记录 | 需求管理、团队管理 |
| 飞书文档 | lark-openapi-mcp | 读取文档内容 | 知识库 Skill |
| 飞书知识库 | lark-openapi-mcp | 读取知识库内容 | 知识库 Skill |
| 飞书日历 | lark-openapi-mcp | 创建/查询日程 | 团队管理 Skill |
| GitHub | GitHub MCP Server | PR 查看/创建、代码搜索、Actions 触发 | 代码 Skill |
| 云平台 | GCP/AWS API | 服务状态查询、日志检索、部署触发 | 运维 Skill |
| 错误追踪 | Sentry API | 错误列表、错误详情、错误趋势 | 运维 Skill |
| 数据分析 | Google Analytics API | 流量数据、用户行为、转化漏斗 | 数据分析 Skill |
| 业务数据库 | PostgreSQL(Skill 直接执行 SQL) | 查询业务数据 | 数据分析 Skill |
5. OpenClaw 核心能力详解
5.1 Skill 系统
Skill 是 OpenClaw 的核心概念 — 每个 Skill 是一个 markdown 文件,定义了 Agent 的一项能力。
# create-requirement
创建需求并归档到飞书多维表格。
## 触发条件
用户消息包含"创建需求"、"新需求"、"提需求"等关键词。
## 执行步骤
1. 从用户消息中提取:标题、描述、优先级、所属模块
2. 如果信息不完整,向用户追问缺失字段
3. 调用飞书 MCP 在需求多维表格中创建记录
4. 设置状态为"待评审"
5. 在需求评审群发送通知消息
6. 将需求信息写入记忆,供后续跟踪
## 输出格式
- 需求标题不超过 50 字
- 描述必须包含"背景"和"验收标准"
- 优先级:P0/P1/P2/P3,不确定时默认 P2
## 权限要求
- 飞书多维表格写入权限
- 飞书消息发送权限Skill 的优势:
- 热更新:修改 markdown 文件即生效,无需重启服务
- 可执行脚本:Skill 中可以嵌入 shell 命令、API 调用
- 可复用:Skill 文件可以在团队间共享
- 版本管理:Skill 文件纳入 Git 管理
5.2 记忆系统
OpenClaw 的记忆分三层:
| 记忆类型 | 存储方式 | 生命周期 | 用途 |
|---|---|---|---|
| 短期记忆 | 内存 | 当前对话 | 对话上下文 |
| 长期记忆 | markdown 文件(~/.openclaw/memory/) | 持久化 | 跨会话记住用户偏好、历史决策 |
| 项目记忆 | 绑定项目目录 | 持久化 | 记住项目结构、技术栈、团队规范 |
记忆系统的价值:
- Agent 记住”上次评审决定 Blinks 课程优先级是 P1”
- Agent 记住”张三负责前端,李四负责后端”
- Agent 积累执行经验,Skill 越用越准
5.3 分级审批策略
| 操作类型 | 风险等级 | 审批策略 |
|---|---|---|
| 读取数据(查询、搜索) | 低 | 自动执行,无需审批 |
| 创建记录(需求、缺陷) | 中 | 自动创建,状态设为”待确认”,通知相关人 |
| 更新状态(流转) | 中 | 自动执行,记录操作日志到记忆 |
| 生成文档(PRD、报告) | 中 | 自动生成草稿,标记为”AI 生成-待审阅” |
| 触发部署 | 高 | 必须人工确认后才执行 |
| 修改代码 | 高 | 只创建 PR,不自动合并 |
6. 产品研发流程串联
Agent 在研发流程中的角色是消除环节之间的摩擦,通过事件驱动 + 状态机实现自动流转:
需求提出 → PRD生成 → 需求评审 → 设计任务 → 设计评审 → 开发 → 代码审查 → 测试 → 部署 → 验收
│ │ │ │ │ │ │ │ │ │
▼ ▼ ▼ ▼ ▼ ▼ ▼ ▼ ▼ ▼
需求Skill 需求Skill 通知Skill 需求Skill 通知 代码 代码 需求 运维 需求
创建记录 生成PRD 评审提醒 创建设计 Skill Skill Skill Skill Skill Skill
归档表格 写入文档 状态流转 任务关联 查PR 触发CI 更新状态 触发部署 标记完成关键设计原则
- 事件驱动 — 通过飞书消息事件、多维表格变更触发,不是轮询
- 状态机驱动 — 需求状态:
待评审 → 已通过 → 设计中 → 开发中 → 待审查 → 测试中 → 待部署 → 已上线 - Human-in-the-Loop — Agent 不做决策,只做信息汇总和流转。评审、审查、验收必须人确认
- 记忆传递 — 每个 Skill 执行后把结果写入 OpenClaw 记忆,下一个 Skill 可以读取上下文
7. 各部门 Skill 覆盖范围
| 部门 | Skill 能力 | 详见 |
|---|---|---|
| Skill 管理 | Skill 注册/发现、版本管理、权限控制、运行监控、热更新 | 37d |
| 产品 | 需求收集、PRD 自动生成、需求归档到多维表格、优先级建议、竞品分析 | 37f |
| 设计 | 设计任务自动创建、设计评审提醒、Figma 设计稿关联 | 37f |
| 开发 | PR 查看/审查、代码搜索、分支管理、CI/CD 触发、缺陷自动创建 | 37f |
| 测试 | 测试用例关联需求、缺陷状态流转、测试报告生成 | 37f |
| 运维 | 日志查询、服务状态监控、告警处理、部署触发、故障复盘归档 | 37i |
| 运营 | 数据查询、增长报告生成、运营策略建议、竞品分析、内容生成 | 37g |
| 人事 | 工作总结自动生成、考勤统计、入离职流程、OKR 跟踪 | 37h |
| 交付 | 项目进度汇总、里程碑提醒、客户交付报告 | 37h |
8. 数据架构
8.1 数据分层策略
┌─────────────────────────────────────┐
│ 操作层(飞书多维表格) │
│ · 需求表 · 缺陷表 · 迭代表 │
│ · 人员表 · 周报表 · OKR表 │
│ · 团队成员直接查看和编辑 │
│ · Skill 通过飞书 MCP 自动读写 │
├─────────────────────────────────────┤
│ 分析层(PostgreSQL) │
│ · 业务数据库(用户、课程、交易) │
│ · 定时从多维表格同步管理数据 │
│ · 跨表关联查询、聚合统计 │
│ · Skill 直接执行 SQL 查询 │
├─────────────────────────────────────┤
│ 知识层 │
│ · OpenClaw 记忆系统(markdown) │
│ · 飞书知识库文档 │
│ · 向量数据库(RAG 检索) │
└─────────────────────────────────────┘8.2 为什么需要数据库层
飞书多维表格作为唯一数据源的局限:
| 局限 | 说明 |
|---|---|
| 跨表关联 | 多维表格的关联字段能力有限,无法做复杂 JOIN |
| 聚合计算 | 不支持 GROUP BY、窗口函数等高级 SQL |
| 数据量 | 单表上限 5 万行,不适合存储用户行为日志 |
| 历史趋势 | 没有时序查询能力 |
加入数据库层后可以做的事:
- 用户增长趋势分析(日活、周活、留存率)
- 课程完成率和学习路径分析
- Hackathon 参与数据和转化漏斗
- 跨部门数据关联(需求交付周期 vs 用户满意度)
9. 实施路线图
建议分 4 个阶段落地,每阶段 2-3 周:
第一阶段:基础设施(第 1-2 周)
- 安装部署 OpenClaw,配置 daemon 持久运行
- 创建飞书应用,配置 feishu 插件
- 配置飞书官方 MCP 和 GitHub MCP
- 编写第一个测试 Skill,验证端到端流程
第二阶段:核心工作流(第 3-5 周)
- 需求/缺陷管理 Skill 组
- 多维表格模板自动创建
- 代码 Skill 组(PR、CI/CD)
- 产品研发流程状态机
第三阶段:知识与分析(第 6-7 周)
- RAG 知识库搭建(飞书知识库 + 向量数据库)
- 数据分析 Skill 组(业务数据库 + GA)
- 运营策略生成 Skill
第四阶段:团队管理与优化(第 8-10 周)
- 团队管理 Skill 组(工作总结、OKR)
- 人事流程自动化 Skill
- 运维 Skill 组(日志、告警、部署)
- 监控和安全加固
10. 成本估算
| 项目 | 方案 | 月成本 |
|---|---|---|
| LLM API | Claude Sonnet(主力)+ Haiku(路由) | ¥500-2000 |
| OpenClaw | 开源免费 | ¥0 |
| 向量数据库 | Chroma(自托管)或 Weaviate Cloud Free Tier | ¥0-500 |
| 服务器 | 1 台 2C4G 云服务器(运行 OpenClaw + 向量数据库) | ¥100-300 |
| 飞书开放平台 | 免费(企业版飞书自带) | ¥0 |
| Google Analytics API | 免费 | ¥0 |
| 合计 | ¥600-2800/月 |
对 30 人团队来说,如果 Agent 每天为每人节省 30 分钟,月节省约 300 人·小时,ROI 非常可观。
下一篇: 37b 飞书机器人与 MCP 搭建 — 安装 OpenClaw、配置飞书插件、接入 MCP 工具层