拆解 Wiki4What:把 AI 工作流当成一家公司来运营

拆解 Wiki4What:把 AI 工作流当成一家公司来运营
英文版:Inside the Wiki4What Workflow Company

很多人聊 AI 工作流,脑子里想的还是一串提示词。

第一个提示词写初稿,第二个润色,第三个排版,第四个发布。中间出了岔子,人就跳进来猜哪儿错了,再试一遍。

这不叫工作流。这顶多算你在跟一个才华横溢但记性极差的自由职业者聊天,他每天早上都把员工手册忘在家里。

真正的 AI 工作流光有提示词不够。它得有“宪法”、有分工、有记忆系统、有工具车间、有发布台,还得有一套复盘机制。说白了,它需要那些让组织正常运转的“无聊”东西:角色、交接、清单、日志、规矩,以及能用确定性机器解决就别靠即兴发挥的流程。

Wiki4What 就是我拿来做公开实验的案例。这是一个讲 AI 时代如何清晰思考的英文 YouTube 频道和 Ghost 博客。但在这些公开内容背后,藏着一家由 Agent 运营的“制作公司”:Claude Code 是执行 CEO,Codex 是外包的视觉工作室(负责静态图和代码协作),还有一组专职子 Agent 分管脚本、调研、结构、分镜、发布、字幕、归档和维护。

这篇文章就是把这家“工作流公司”拆开给你看:它需要哪些文档、设了什么岗位、底层用了什么工具,以及一条内容如何从点子变成发布资产,而不是靠一个巨大的提示词硬撑。

思维模型:把工作流当公司开

最有用的认知转变,是别老问“我该写什么提示词”,改问“我在建一家什么公司”。

公司有法度,有 CEO,有部门,有岗位说明书,有共享手册,有车间设备,有档案室,还有出货前的质检流程。

Agent 工作流也得有这些层:

公司层级 工作流对应物 为什么重要
宪法 CONSTITUTION.md 定下不可逾越的红线和判断准则
运营手册 WORKFLOW.md 描述从灵感到发布的主干流程
组织架构图 ROLES.md 把责任落实到子 Agent 和技能上
培训手册 技能(Skills) 传授可复用能力,避免每个提示词都臃肿不堪
车间机器 CLI 工具和 API 反复执行确定性任务
档案室 内容库 + 向量数据库 保存最终资产,方便检索复用
董事会审核 人工审批关卡 把主观判断权留在人手里

缺了哪一层,责任就会漏到聊天窗口里。主 Agent 被迫死记政策,干活 Agent 开始即兴发挥,发布变成玄学仪式,同一个依赖挂两次,同一篇文章因为没人查档案而被重复创建。

药方不是写更长的提示词,而是建一家更健全的公司。

宪法:先立规矩,再谈品味

正经工作流都得有部宪法:一份简短、耐用的文档,回答“我们是个什么组织”。

Wiki4What 制作公司的宪法规定了运营姿态:

  • 人类老板定方向、把关主观质量、决定品牌价值。
  • 主 Agent 是 CEO:拆解任务、调度专家、审计产出、如实汇报。
  • 子 Agent 是员工或部门负责人:领受边界清晰的任务,交付可验证的产物。
  • 可重复的机械步骤必须变成命令行工具。
  • Bug 要用来改进系统,而不是打完补丁就扔。
  • 敏感凭证绝不能写进普通文档或提交记录。

这不是为了搞官僚主义。宪法是为了让 CEO 在老板不盯着的时候,也能做出一致的决策。

渲染挂了,宪法说:修工作流,别手动补输出。要做封面图,宪法说:用频道设计语言,别临时起意。博客发了,宪法说:验公开链接、归档源文件、把终稿入库。

宪法把判断变成了法律。

工作流主干:从灵感到公开资产

Wiki4What 有两条关联产线。

第一条是完整视频流水线:脚本、事实核查、润色、结构化、分镜制作、渲染、合成、字幕、YouTube 发布、Ghost 配套文章、归档、复盘。

第二条是独立 Ghost 博客流水线:调研或撰写英文文章、生成题图、发布到 Ghost、验证公开页面、归档规范源文件、入库。

关键的设计选择是:第二条线不假装自己是第一条。独立博文不需要视频结构、分镜渲染、音频、字幕或片段构建目录。它有自己的生命周期。

这就是工作流主干的意义:别让一个小任务拖着整个工厂跑。

现在,独立 Ghost 文章的主干长这样:

  1. 搜内容库,查重。
  2. 写英文源稿。
  3. 给英文页和未来中文镜像页分配 slug。
  4. 根据频道设计语言生成确定性的封面简报。
  5. 调 Codex 原生能力生成静态图。
  6. 把封面统一裁成 16:9 的 Ghost 题图尺寸。
  7. 试运行 Ghost 更新。
  8. 审批通过后发布。
  9. 验证公开页面。
  10. 归档源稿、封面、简报和元数据。
  11. 把终稿写入 SQLite 和 ChromaDB。

注意这个形态:主 Agent 不用“记住”流程,流程文档替它记。

角色:小公司,岗位要实名

Wiki4What 工作流设角色,是因为责任必须落到具体位置。

如果所有 Agent 都叫“助手”,那就谁都不负责。脚本出错是大家的问题,图片提示词坏了是大家的问题,数据库条目过期还是大家的问题。工作流就是这么变成一团雾的。

角色能驱散这团雾。

核心角色就像一家小型媒体公司:

角色 职责
CEO 统筹、审核、验证、向老板汇报
编剧 起草英文脚本或文章
事实核查员 验证论点,揪出没依据的断言
润色编辑 让终稿清晰、自然、可发布
结构架构师 把视频脚本拆成分镜和交接数据
分镜制作人 用合适的视觉后端构建画面段落
Ghost 博客 Agent 负责 Ghost 文章、镜像页、归档和博客入库
发布专员 有视频时负责发 YouTube
字幕制作人 制作并校准字幕
开发维护员 修代码、CLI、文档、技能和 Agent 定义
Codex 视觉工作室 通过契约边界产出静态图和视觉资产

Claude Code 和 Codex 的边界很重要。Claude Code 是执行 CEO 和内部员工运行时;Codex 是外部视觉工作室和代码协作者。它能做内部员工不该直接做的事(尤其是生图),但必须通过契约调用:一份简报、一个文件路径、一个预期产物、一份回报。

这个区分不是面子工程。它防止生图变成写作 Agent 里看不见的副作用,也让工作流留下干净的审计轨迹:谁要的图、用了什么简报、终稿存哪儿、哪步确定性后处理让它达到发布标准。

技能:是培训手册,不是人设

角色是人,技能是手册。

角色说:“你是 Ghost 博客负责人。”技能说:“Ghost 发布具体这么操作:跑哪个预检、用哪条命令发文、怎么发镜像页、怎么验公开链接、怎么归档结果。”

这种分离让系统好维护。Ghost 发布 API 改了,只需更新 Ghost 发布技能和 CLI,子 Agent 不用重写人设。封面设计规则变了,改封面简报命令就行,以后所有文章自动继承修正。

Wiki4What 里好几个技能就像共享手册:

  • Ghost 发布(文章和页面的增改)。
  • Codex 原生图片策略(静态图)。
  • R2 存储与渲染(视频资产)。
  • 智能字幕(字幕对齐)。
  • 选题调研(发现新点子)。
  • 设计语言规则(封面、模板、UI 界面)。

核心纪律是:技能必须指向可执行工具。技能不能只描述理想状态,得教 Agent 跑哪条命令。

命令行工具:确定性该待的地方

公司的底层不光鲜。它是 Python、Shell 命令、校验器、API 客户端和小 CLI。

但这才是正经工作流赢的地方。

可重复的任务别留在模型的想象里,要变成命令:

  • 检查 Ghost 凭证。
  • 生成封面设计简报。
  • 把封面图统一到 1280x720。
  • 按 slug 发布或更新 Ghost 文章。
  • 验证公开链接含预期标题和图片。
  • 把博客源稿归档到规范目录。
  • 把终稿写入内容库。
  • 写之前先搜向量库。

模型擅长判断、综合和语言。但文件命名规则、重试逻辑、数据库 schema、图片尺寸、幂等性检查,不该让它管。

实操原则很简单:

同一个决策如果要以同样方式做两次,就把它做成 CLI。

工作流就是这么越跑越便宜的。

档案:记忆即基础设施

公开内容工作流不能只有发布链接,还得有本地记忆,记下到底做了什么。

Wiki4What 里,每篇独立 Ghost 博客文章都有个内容归档目录:

content_archive/ghost/<slug>/
├── source_en.md
├── source_zh.md
├── cover.jpg
├── cover_brief.json
└── publish.json

档案故意做得很无聊,这正是它的优点。它为系统提供了英文文章、可选中文镜像、最终封面、封面设计简报和 Ghost 元数据的本地规范源。

然后数据库层给它建索引。SQLite 存精确元数据:内容 ID、标题、slug、语言、Ghost ID、URL、状态、源路径、封面路径、标签、摘要、镜像关系。ChromaDB 存文本块,供语义搜索。

默认搜索范围是规范英文内容。中文镜像页可以索引,但会标记为镜像,除非显式请求否则排除。这保护了编辑工作流:英文文章是主资产,译文留给需要的读者。

这就是“我们发了篇文章”和“公司记住了自己发过什么”的区别。

交接:传句柄,别传载荷

Wiki4What 工作流有条微妙但关键的规矩:交接传句柄,别传大载荷。

CEO 不贴整篇文章,传路径;不贴所有图片要求,传封面简报文件;不让干活的 Agent 背整个生产历史,指给它档案或构建目录。

这样上下文窗口小,责任也清楚。干活的读自己负责的文件,CEO 验产出,数据库记终态。

这和优秀的软件系统一个道理:服务间传 ID,不传整个库;人间传工单,不传口述史。Agent 工作流也该如此。

生产原则:智能做设计,机器去执行

Wiki4What 给的公开启示,不是让每个创作者都用同款工具,而是每个正经 AI 工作流终将面对同一个设计问题:

智能该放哪儿?

我的答案是:把智能放在系统设计、判断、调研、行文和修复上。把确定性执行放进工具。把记忆放进文件和数据库。把主观审批留给人类老板。把视觉生成放在显式契约后面。把重复流程做成技能。

所以,系统里最强的模型不该把 token 烧在机械步骤上,它该用来改进这家公司。

公司才会越跑越便宜、越快、越稳。

好工作流该有什么

如果你在设计自己的 Agent 工作流,从这份清单起步:

  • 一部宪法,写明使命、优先级、红线和升级规则。
  • 一条工作流主干,列清每步、产出和负责人。
  • 一份角色注册表,分清 CEO、内部员工、外部伙伴和维护员。
  • 一组技能,充当可复用的能力培训手册。
  • 一套命令行工具,处理确定性步骤。
  • 一套设计语言,规范视觉产物。
  • 一个档案标准,保存终稿源文件和元数据。
  • 一个向量数据库,供搜索、去重和复用。
  • 一组验证命令,查公开现实,不信 Agent 自报。
  • 一个复盘闭环,把每次失败变成系统升级。

看得见的产出可能是视频、文章、封面图或博客。但更深层的产品,是这家工作流公司本身。

一旦这家公司立住了,下一条内容就不再是英雄壮举,而是一次常规运营。