拆解 Wiki4What:把 AI 工作流当成一家公司来运营
英文版:Inside the Wiki4What Workflow Company
很多人聊 AI 工作流,脑子里想的还是一串提示词。
第一个提示词写初稿,第二个润色,第三个排版,第四个发布。中间出了岔子,人就跳进来猜哪儿错了,再试一遍。
这不叫工作流。这顶多算你在跟一个才华横溢但记性极差的自由职业者聊天,他每天早上都把员工手册忘在家里。
真正的 AI 工作流光有提示词不够。它得有“宪法”、有分工、有记忆系统、有工具车间、有发布台,还得有一套复盘机制。说白了,它需要那些让组织正常运转的“无聊”东西:角色、交接、清单、日志、规矩,以及能用确定性机器解决就别靠即兴发挥的流程。
Wiki4What 就是我拿来做公开实验的案例。这是一个讲 AI 时代如何清晰思考的英文 YouTube 频道和 Ghost 博客。但在这些公开内容背后,藏着一家由 Agent 运营的“制作公司”:Claude Code 是执行 CEO,Codex 是外包的视觉工作室(负责静态图和代码协作),还有一组专职子 Agent 分管脚本、调研、结构、分镜、发布、字幕、归档和维护。
这篇文章就是把这家“工作流公司”拆开给你看:它需要哪些文档、设了什么岗位、底层用了什么工具,以及一条内容如何从点子变成发布资产,而不是靠一个巨大的提示词硬撑。
思维模型:把工作流当公司开
最有用的认知转变,是别老问“我该写什么提示词”,改问“我在建一家什么公司”。
公司有法度,有 CEO,有部门,有岗位说明书,有共享手册,有车间设备,有档案室,还有出货前的质检流程。
Agent 工作流也得有这些层:
| 公司层级 | 工作流对应物 | 为什么重要 |
|---|---|---|
| 宪法 | CONSTITUTION.md |
定下不可逾越的红线和判断准则 |
| 运营手册 | WORKFLOW.md |
描述从灵感到发布的主干流程 |
| 组织架构图 | ROLES.md |
把责任落实到子 Agent 和技能上 |
| 培训手册 | 技能(Skills) | 传授可复用能力,避免每个提示词都臃肿不堪 |
| 车间机器 | CLI 工具和 API | 反复执行确定性任务 |
| 档案室 | 内容库 + 向量数据库 | 保存最终资产,方便检索复用 |
| 董事会审核 | 人工审批关卡 | 把主观判断权留在人手里 |
缺了哪一层,责任就会漏到聊天窗口里。主 Agent 被迫死记政策,干活 Agent 开始即兴发挥,发布变成玄学仪式,同一个依赖挂两次,同一篇文章因为没人查档案而被重复创建。
药方不是写更长的提示词,而是建一家更健全的公司。
宪法:先立规矩,再谈品味
正经工作流都得有部宪法:一份简短、耐用的文档,回答“我们是个什么组织”。
Wiki4What 制作公司的宪法规定了运营姿态:
- 人类老板定方向、把关主观质量、决定品牌价值。
- 主 Agent 是 CEO:拆解任务、调度专家、审计产出、如实汇报。
- 子 Agent 是员工或部门负责人:领受边界清晰的任务,交付可验证的产物。
- 可重复的机械步骤必须变成命令行工具。
- Bug 要用来改进系统,而不是打完补丁就扔。
- 敏感凭证绝不能写进普通文档或提交记录。
这不是为了搞官僚主义。宪法是为了让 CEO 在老板不盯着的时候,也能做出一致的决策。
渲染挂了,宪法说:修工作流,别手动补输出。要做封面图,宪法说:用频道设计语言,别临时起意。博客发了,宪法说:验公开链接、归档源文件、把终稿入库。
宪法把判断变成了法律。
工作流主干:从灵感到公开资产
Wiki4What 有两条关联产线。
第一条是完整视频流水线:脚本、事实核查、润色、结构化、分镜制作、渲染、合成、字幕、YouTube 发布、Ghost 配套文章、归档、复盘。
第二条是独立 Ghost 博客流水线:调研或撰写英文文章、生成题图、发布到 Ghost、验证公开页面、归档规范源文件、入库。
关键的设计选择是:第二条线不假装自己是第一条。独立博文不需要视频结构、分镜渲染、音频、字幕或片段构建目录。它有自己的生命周期。
这就是工作流主干的意义:别让一个小任务拖着整个工厂跑。
现在,独立 Ghost 文章的主干长这样:
- 搜内容库,查重。
- 写英文源稿。
- 给英文页和未来中文镜像页分配 slug。
- 根据频道设计语言生成确定性的封面简报。
- 调 Codex 原生能力生成静态图。
- 把封面统一裁成 16:9 的 Ghost 题图尺寸。
- 试运行 Ghost 更新。
- 审批通过后发布。
- 验证公开页面。
- 归档源稿、封面、简报和元数据。
- 把终稿写入 SQLite 和 ChromaDB。
注意这个形态:主 Agent 不用“记住”流程,流程文档替它记。
角色:小公司,岗位要实名
Wiki4What 工作流设角色,是因为责任必须落到具体位置。
如果所有 Agent 都叫“助手”,那就谁都不负责。脚本出错是大家的问题,图片提示词坏了是大家的问题,数据库条目过期还是大家的问题。工作流就是这么变成一团雾的。
角色能驱散这团雾。
核心角色就像一家小型媒体公司:
| 角色 | 职责 |
|---|---|
| CEO | 统筹、审核、验证、向老板汇报 |
| 编剧 | 起草英文脚本或文章 |
| 事实核查员 | 验证论点,揪出没依据的断言 |
| 润色编辑 | 让终稿清晰、自然、可发布 |
| 结构架构师 | 把视频脚本拆成分镜和交接数据 |
| 分镜制作人 | 用合适的视觉后端构建画面段落 |
| Ghost 博客 Agent | 负责 Ghost 文章、镜像页、归档和博客入库 |
| 发布专员 | 有视频时负责发 YouTube |
| 字幕制作人 | 制作并校准字幕 |
| 开发维护员 | 修代码、CLI、文档、技能和 Agent 定义 |
| Codex 视觉工作室 | 通过契约边界产出静态图和视觉资产 |
Claude Code 和 Codex 的边界很重要。Claude Code 是执行 CEO 和内部员工运行时;Codex 是外部视觉工作室和代码协作者。它能做内部员工不该直接做的事(尤其是生图),但必须通过契约调用:一份简报、一个文件路径、一个预期产物、一份回报。
这个区分不是面子工程。它防止生图变成写作 Agent 里看不见的副作用,也让工作流留下干净的审计轨迹:谁要的图、用了什么简报、终稿存哪儿、哪步确定性后处理让它达到发布标准。
技能:是培训手册,不是人设
角色是人,技能是手册。
角色说:“你是 Ghost 博客负责人。”技能说:“Ghost 发布具体这么操作:跑哪个预检、用哪条命令发文、怎么发镜像页、怎么验公开链接、怎么归档结果。”
这种分离让系统好维护。Ghost 发布 API 改了,只需更新 Ghost 发布技能和 CLI,子 Agent 不用重写人设。封面设计规则变了,改封面简报命令就行,以后所有文章自动继承修正。
Wiki4What 里好几个技能就像共享手册:
- Ghost 发布(文章和页面的增改)。
- Codex 原生图片策略(静态图)。
- R2 存储与渲染(视频资产)。
- 智能字幕(字幕对齐)。
- 选题调研(发现新点子)。
- 设计语言规则(封面、模板、UI 界面)。
核心纪律是:技能必须指向可执行工具。技能不能只描述理想状态,得教 Agent 跑哪条命令。
命令行工具:确定性该待的地方
公司的底层不光鲜。它是 Python、Shell 命令、校验器、API 客户端和小 CLI。
但这才是正经工作流赢的地方。
可重复的任务别留在模型的想象里,要变成命令:
- 检查 Ghost 凭证。
- 生成封面设计简报。
- 把封面图统一到 1280x720。
- 按 slug 发布或更新 Ghost 文章。
- 验证公开链接含预期标题和图片。
- 把博客源稿归档到规范目录。
- 把终稿写入内容库。
- 写之前先搜向量库。
模型擅长判断、综合和语言。但文件命名规则、重试逻辑、数据库 schema、图片尺寸、幂等性检查,不该让它管。
实操原则很简单:
同一个决策如果要以同样方式做两次,就把它做成 CLI。
工作流就是这么越跑越便宜的。
档案:记忆即基础设施
公开内容工作流不能只有发布链接,还得有本地记忆,记下到底做了什么。
Wiki4What 里,每篇独立 Ghost 博客文章都有个内容归档目录:
content_archive/ghost/<slug>/
├── source_en.md
├── source_zh.md
├── cover.jpg
├── cover_brief.json
└── publish.json
档案故意做得很无聊,这正是它的优点。它为系统提供了英文文章、可选中文镜像、最终封面、封面设计简报和 Ghost 元数据的本地规范源。
然后数据库层给它建索引。SQLite 存精确元数据:内容 ID、标题、slug、语言、Ghost ID、URL、状态、源路径、封面路径、标签、摘要、镜像关系。ChromaDB 存文本块,供语义搜索。
默认搜索范围是规范英文内容。中文镜像页可以索引,但会标记为镜像,除非显式请求否则排除。这保护了编辑工作流:英文文章是主资产,译文留给需要的读者。
这就是“我们发了篇文章”和“公司记住了自己发过什么”的区别。
交接:传句柄,别传载荷
Wiki4What 工作流有条微妙但关键的规矩:交接传句柄,别传大载荷。
CEO 不贴整篇文章,传路径;不贴所有图片要求,传封面简报文件;不让干活的 Agent 背整个生产历史,指给它档案或构建目录。
这样上下文窗口小,责任也清楚。干活的读自己负责的文件,CEO 验产出,数据库记终态。
这和优秀的软件系统一个道理:服务间传 ID,不传整个库;人间传工单,不传口述史。Agent 工作流也该如此。
生产原则:智能做设计,机器去执行
Wiki4What 给的公开启示,不是让每个创作者都用同款工具,而是每个正经 AI 工作流终将面对同一个设计问题:
智能该放哪儿?
我的答案是:把智能放在系统设计、判断、调研、行文和修复上。把确定性执行放进工具。把记忆放进文件和数据库。把主观审批留给人类老板。把视觉生成放在显式契约后面。把重复流程做成技能。
所以,系统里最强的模型不该把 token 烧在机械步骤上,它该用来改进这家公司。
公司才会越跑越便宜、越快、越稳。
好工作流该有什么
如果你在设计自己的 Agent 工作流,从这份清单起步:
- 一部宪法,写明使命、优先级、红线和升级规则。
- 一条工作流主干,列清每步、产出和负责人。
- 一份角色注册表,分清 CEO、内部员工、外部伙伴和维护员。
- 一组技能,充当可复用的能力培训手册。
- 一套命令行工具,处理确定性步骤。
- 一套设计语言,规范视觉产物。
- 一个档案标准,保存终稿源文件和元数据。
- 一个向量数据库,供搜索、去重和复用。
- 一组验证命令,查公开现实,不信 Agent 自报。
- 一个复盘闭环,把每次失败变成系统升级。
看得见的产出可能是视频、文章、封面图或博客。但更深层的产品,是这家工作流公司本身。
一旦这家公司立住了,下一条内容就不再是英雄壮举,而是一次常规运营。